(點選上方公眾號,可快速關註)
來源:瀟湘隱者 ,
www.cnblogs.com/kerrycode/p/9650629.html
昨天一開發同事反饋一個儲存過程很慢,但是重編譯後,儲存過程就很快了。瞭解基本情況後,初步判斷是引數嗅探問題。那麼如何診斷定位、分析問題呢?下麵簡單介紹一下這次引數嗅探問題定位的流程過程。
首先檢視該儲存過程的執行計劃相關資訊:
如下截圖所示,此儲存過程是2018-09-12 9:03:01快取的,最後一次執行是2018-09-14 08:58,而且自上次快取後,執行了24875次。從這裡我們基本判斷該儲存過程一直在重用快取的執行計劃,而且沒有產生重編譯現象。
SELECT d.object_id ,
d.database_id ,
OBJECT_NAME(object_id, database_id) ‘proc name’ ,
d.cached_time ,
d.last_execution_time ,
d.total_elapsed_time ,
d.total_elapsed_time / d.execution_count AS [avg_elapsed_time] ,
d.last_elapsed_time ,
d.execution_count
FROM sys.dm_exec_procedure_stats AS d
WHERE OBJECT_NAME(object_id, database_id) = ‘sp_GetOTList’
ORDER BY [total_worker_time] DESC;
然後我們使用下麵指令碼找到該儲存過程的實際執行計劃,將儲存過程的執行計劃的XML內容複製到Plan Explorer工具。生成比較清晰、詳細的執行計劃圖。
SELECT
d.object_id ,
DB_NAME(d.database_id) DBName ,
OBJECT_NAME(object_id, database_id) ‘SPName’ ,
d.cached_time ,
d.last_execution_time ,
d.total_elapsed_time/1000000 AS total_elapsed_time,
d.total_elapsed_time / d.execution_count/1000000
AS [avg_elapsed_time] ,
d.last_elapsed_time/1000000 AS last_elapsed_time,
d.execution_count ,
d.total_physical_reads ,
d.last_physical_reads ,
d.total_logical_writes ,
d.last_logical_reads ,
et.text SQLText ,
eqp.query_plan executionplan
FROM sys.dm_exec_procedure_stats AS d
CROSS APPLY sys.dm_exec_sql_text(d.sql_handle) et
CROSS APPLY sys.dm_exec_query_plan(d.plan_handle) eqp
WHERE OBJECT_NAME(object_id, database_id) = ‘sp_GetOTList’
ORDER BY [total_worker_time] DESC;
如下截圖所示,我們可以清晰的找到Est Cost、 Est Cpu Cost、 Est IO Cost等高的SQL陳述句(其實這個是實際執行計劃,而不是預估的執行計劃),然後重點研究、對比, 然後使用WITH(RECOMPILE)重新執行該儲存過程,生成新的執行計劃,然後按照上面方式將儲存過程執行計劃的XML複製到Plan Explorer工具裡面。 然後我們可以對比、研究看看到底出現了什麼情況
舊的實際執行計劃
如上截圖所示,開銷最大的SQL陳述句的實際執行計劃如上所示,註意開銷佔比最大的地方。 下麵截圖是Nested Loops裡面迴圈的次數(迭代次數20次),也是我們對比執行計劃需要重點關註的地方。
新的實際執行計劃
新的執行計劃中,可以看到舊執行計劃開銷最大的SQL陳述句在整體開銷的佔比減少了很多,但是該陳述句的新舊執行計劃是一樣的。唯一不同的就是兩個Nested Loops裡面迴圈的次數不一樣。這個就是產生效能差異的地方,如果對巢狀迴圈連線不太熟悉,可以參考一下下麵這段內容:
Nested Loops也稱為巢狀迭代,它將一個聯接輸入用作外部輸入表(顯示為圖形執行計劃中的頂端輸入),將另一個聯接輸入用作內部(底端)輸入表。外部迴圈逐行消耗外部輸入表。內部迴圈為每個外部行執行,在內部輸入表中搜索匹配行。最簡單的情況是,搜尋時掃描整個表或索引;這稱為單純巢狀迴圈聯接。如果搜尋時使用索引,則稱為索引巢狀迴圈聯接。如果將索引生成為查詢計劃的一部分(併在查詢完成後立即將索引破壞),則稱為臨時索引巢狀迴圈聯接。
舊執行計劃:
-
巢狀迴圈次數:20* 30
-
巢狀迴圈次數:20*20
新執行計劃:
-
巢狀迴圈次數: 1* 1
-
巢狀迴圈次數: 1* 1
那麼為什麼產生這個差異,就是因為儲存過程裡面一段SQL陳述句使用了儲存過程引數,而恰巧裡面那個表按照這個欄位的資料分佈很不均衡。所以當儲存過程按照第一次傳入的引數生成執行計劃並快取下來,而按照那個引數生成的執行計劃並不是一直都是最優執行計劃,那麼就導致了效能問題出現了,這也就是引數嗅探問題。
解決方法
在SQL陳述句後面使用HINT提示來解決引數嗅探,本想在對應的SQL陳述句後面使用OPTION (RECOMPILE) ,但是考慮此儲存過程呼叫頻繁,而且同事極力推薦使用提示OPTION (OPTIMIZE FOR UNKNOWN).修改過後,效能測試效果也確實顯著。
【關於投稿】
如果大家有原創好文投稿,請直接給公號傳送留言。
① 留言格式:
【投稿】+《 文章標題》+ 文章連結
② 示例:
【投稿】《不要自稱是程式員,我十多年的 IT 職場總結》:http://blog.jobbole.com/94148/
③ 最後請附上您的個人簡介哈~
看完本文有收穫?請轉發分享給更多人
關註「ImportNew」,提升Java技能