白話文解說 Process 與 Thread
對於學生以及剛出社會的新鮮人來說, Process 與 Thread 的差異通常難以解釋清楚,以我為例,我學生時期也經常在作業系統課上打瞌睡⋯⋯,因此當年也不甚清楚這 2 者的差異。
首先,程式還沒執行之前稱為 Program, 可以想像是一個服務提供者,例如專門泡咖啡的服務提供者。
當我們需要 Program 所提供的服務時,我們會執行 Program ,這時 Program 會變成 Process 開始提供服務,舉提供一杯咖啡為例,它需要水、咖啡豆、杯子等資源,所以 Process 會擁有系統資源(記憶體、檔案、裝置等等)以提供服務。
光有資源不夠,還需要有人執行泡咖啡這項任務,所以對 Process 來說,就需要 Thread 執行任務,因此 Thread 會使用 Process 的資源執行相關任務,Thread 的數量可以是 1 到多個,也由於這些 Threads 都是使用同 1 個 Process 的資源,所以大家才會說:
- 同 1 個 Process 底下的 Threads 之間的資源(例如記憶體)是共享的
- 建立 Process 比起建立 Thread 來得慢,因為建立 Process 需要分配獨立的系統資源,也涉及複製 Process 狀態與記憶體等動作
這時帶出 2 個觀念:
- 只有 1 個 Thread 的 Process 稱為 single-threaded process, 例如 REDIS, NodeJS
- 擁有多個 Thread 的 Process 稱為 multi-threaded process, 例如 MySQL
到目前為止,我們講的 Thread 是 OS Thread, 也就是由作業系統用來代表 CPU Thread 的抽象化,因為實際運算還是由 CPU 執行,所以 CPU Thread 是 CPU 執行工作的最小單位(當然要說 Thread 是 CPU 執行最小單位也沒問題)。
不過 CPU 可以同時執行 CPU Thread 的數量是有限制的,但是作業系統的 OS Threads 通常多過 CPU 可以同時執行的數量,所以作業系統才會有所謂排程管理(scheduler / scheduling),決定哪些 OS Thread 的工作要交給 CPU 執行,簡單來說是將 CPU 執行工作的時間切的非常短,讓 CPU 迅速不斷地執行不同 OS Thread 的工作,讓人感覺上就像這個 CPU 同時間在做很多工作一樣(就像 How 哥很愛做的殘影分身特效一樣,藉由高速移動所產生的殘影,讓人感覺產生分身一樣)。
簡單來說, OS Thread 是軟體層級的概念, CPU Thread 是硬體層級的概念。
再回來講 Process 。
1 個作業系統裡當然也不會只有 1 個 Process 在提供服務,為了避免 Process 互相干擾,所以 Process 之間都是獨立的,它們無法像 Thread 般共享資源,所以不同的 Processes 溝通才需要 IPC(Inter-Process Communication) 技術,所以:
- Processes 之間的溝通效率會比 Threads 之間溝通的效率差,畢竟 Threads 之間可以直接用共享的記憶體就進行溝通
1 個 Program 也不一定就只有 1 個 Process 提供服務,舉 Chrome 瀏覽器為例,它每開 1 個分頁就會多開 1 個 Process 處理,它的做法是由主要的 Process (稱為 Parent Process 建立 1 個新的 Process (稱為 Child Process)提供服務。
Chrome 用多個 Processes 提供服務的好處在於每個 Process 彼此都是獨立的,不會互相影響,就算其中 1 個分頁發生問題,也不會影響其他分頁的運作,另外是多個 Processes 可以在多核心 CPU 中同時執行以提高效能,如果是使用多執行緒的架構,就很有可能會發生其中 1 個分頁壞掉就導致整個瀏覽器停擺的情況,因為 Thread 共享資源的特性很可能會影響到其他 Thread 的運作。
以上!