1. 伺服器執行緒概念
一般伺服器都需要承受較高的存取量,能夠同時回應不同使用者的請求,在伺服器中使用執行緒來處理接收的每個請求,若能夠合理管理執行緒數,伺服器就能夠更好的在惡劣環境下保持較高的穩定性和健壯性。
各 Web 伺服器管理執行緒主要用到如下幾個參數:
伺服器最少保證的執行緒數;
伺服器併發處理的最大任務個數,超過該數時,請求會進入等待,等待閒置執行緒;
伺服器執行緒數超過最大執行緒數,進入等待的請求,超過最大等待時間時,伺服器會絕此次請求,傳回 connection refused。
2. 如何設定伺服器執行緒數
一般的伺服器操作都包括兩方面:計算(主要消耗 CPU)、等待(IO、資料庫等),最重要的參數就是“最大執行緒數”:
第一種極端情況,如果我們的操作是純粹的計算,那麼系統回應時間的主要限制就是 CPU 的運算能力,此時最大執行緒數應該儘量設的小,降低同一時間內爭搶 CPU 的執行緒個數,可以提高計算效率,提高系統的整體處理能力。
第二種極端情況,如果我們的操作是純粹IO或者資料庫,那麼回應時間的主要限制就變為等待外部資源,此時最大執行緒數應該儘量設的大,這樣才能提高同時處理請求的個數,進而提高系統整體的處理能力。此情況下因為Tomcat同時處理的請求量會比較大,所以需要關注一下 Tomcat 的虛擬機記憶體設定和 Linux 的 open file 限制。
而現實應用中,我們的操作都會包含以上兩種類型(計算、等待),所以最大執行緒數的配置並沒有一個最優值,一定要根據具體情況來配置。
最好的做法是:在不斷測試的基礎上,不斷調整、優化,才能得到最合理的配置。
索引: