Posted on 2019-01-10 11:38
Prayer 閱讀(2124)
評論(0) 編輯 收藏 引用 所屬分類:
DB2
https://blog.csdn.net/zhan19861022/article/details/7697652
一、IN 和EXISTS的性能區別
in 是把外表和內表作hash 連接,而exists是對外表作loop循環,每次loop循環再對內表進行查詢。
其實區分in和exists主要是造成了驅動順序的改變(這是性能變化的關鍵),如果是exists,那么以外層表為驅動表,先被訪問,如果是IN,那么先執行子查詢,所以我們會以驅動表的快速返回為目標,那么就會考慮到索引及結果集的關系了。
EXISTS的執行流程
select * from t1 where exists ( select null from t2 where y = x )
可以理解為:
for x in ( select * from t1 ) loop if ( exists ( select null from t2 where y = x.x ) then OUTPUT THE RECORD end if end loop
二、not in 和 not exists的性能區別:
not in 只有當子查詢中,select 關鍵字后的字段有not null約束或者有這種暗示時用not in,另外如果主查詢中表大,子查詢中的表小但是記錄多,則應當使用not in,并使用anti hash join.
如果主查詢表中記錄少,子查詢表中記錄多,并有索引,可以使用not exists。如果查詢語句使用了not in 那么內外表都進行全表掃描,沒有用到索引;而not extsts 的子查詢依然能用到表上的索引。所以無論哪個表大,用not exists都比not in要快。
總結not exists >> not in,in與exists的使用取決于子查詢集合大小,IN適合于外表大而內表小的情況;EXISTS適合于外表小而內表大的情況,即如果子查詢得出的結果集記錄較少,主查詢中的表較大且又有索引時應該用in,反之如果外層的主查詢記錄較少,子查詢中的表大,又有索引時使用exists。