白話文解說 Unix Domain Socket
談到如何跨 process 進行溝通,也就是所謂的 IPC (Inter-Process Communication),通常大家會直覺想到用 HTTP 協定架 API Server, 讓多個不同的 process 透過 API 溝通,這是現代應用經常使用的手段,好處在於各個團隊可以使用不同程式語言、框架進行開發,而且 scalability 也相當不錯,哪個 API Server 遇到效能瓶頸可以 scale up 提升效能或者多開幾台機器提供服務。
不過透過 HTTP 協定進行溝通需要透過 TCP/IP 網路層, TCP/IP 本身的設計就有考慮到網路傳輸具有不穩定性,譬如三向交握(Three-way Handshake)就是為了確保 client 與 server 之間確實建立連線,這些設計的代價是所謂的 network overhead, 你得付出一些代價確保傳輸品質,導致溝通效率沒有同 1 台機器上直接透過記憶體溝通來得有效率。 而且也不是所有應用都適合用 HTTP 協定進行溝通,例如某些特別要求處理速度的 data pipeline, 如果透過 HTTP 溝通最終還是會遇到 HTTP 協定本身的瓶頸,你就是得付出一定的時間做網路傳輸。
這時你可以使用 Unix Domain Socket 解決網路層的效能瓶頸。
Unix Domain Socket 是 *nix 系統專屬的 1 種 IPC 方法(抱歉了 Windows ),特點是 client 與 server 都必須在同 1 台機器上運作,所以跨 process 溝通才不需要經過網路層,這 2 者之間的溝通是透過 Kernel 與檔案系統支援的。
使用 Unix Domain Socket 時, server process 會在檔案系統中建立 1 個 file descriptor 作為接口,其他 client process 則是透過打開該 file descriptor 讀取資料或寫入資料以進行溝通(實際上沒有真的寫資料到 disk, 而是記憶體),而且 Unix Domain Socket 支援 Stream mode 以及 Datagram mode, 也就是分別對應 TCP 與 UDP 的應用場景(TCP 雙向、 UDP 單向)。
著名的 MySQL, Docker 都有使用 Unix Domain Socket, 所以你可以在路徑 /var/run/mysqld/mysql.sock
找到 MySQL 的 Unix Domain Socket, 或者 /tmp
底下也有可能有其他 processes 所建立的 Unix Domain Socket 。
以後看到這些 *.socket
的檔案,你就會知道「噢,應該是 Unix Domain Socket 」囉~