25张图,一万字,拆解Linux网络包发送过程(超级详细~)
25張圖
,一萬字,拆解Linux網(wǎng)絡(luò)包發(fā)送過程(超級詳細(xì)~)
半年前我以源碼的方式描述了網(wǎng)絡(luò)包的接收過程 。之后不斷有粉絲提醒我還沒聊發(fā)送過程呢。好,安排!
在開始今天的文章之前 ,我先來請大家思考幾個小問題 。
- 問1:我們在查看內(nèi)核發(fā)送數(shù)據(jù)消耗的 CPU 時,是應(yīng)該看 sy 還是 si ?
- 問2 :為什么你服務(wù)器上的 /proc/softirqs 里 NET_RX 要比 NET_TX 大的多的多 ?
- 問3 :發(fā)送網(wǎng)絡(luò)數(shù)據(jù)的時候都涉及到哪些內(nèi)存拷貝操作?
這些問題雖然在線上經(jīng)??吹? ,但我們似乎很少去深究。如果真的能透徹地把這些問題理解到位 ,我們對性能的掌控能力將會變得更強(qiáng) 。
帶著這三個問題 ,我們開始今天對 Linux 內(nèi)核網(wǎng)絡(luò)發(fā)送過程的深度剖析。還是按照我們之前的傳統(tǒng),先從一段簡單的代碼作為切入 。如下代碼是一個典型服務(wù)器程序的典型的縮微代碼 :
int main(){ fd = socket(AF_INET, SOCK_STREAM, 0); bind(fd, ...); listen(fd, ...); cfd = accept(fd, ...); // 接收用戶請求 read(cfd, ...); // 用戶請求處理 dosometing(); // 給用戶返回結(jié)果 send(cfd, buf, sizeof(buf), 0);}今天我們來討論上述代碼中,調(diào)用 send 之后內(nèi)核是怎么樣把數(shù)據(jù)包發(fā)送出去的 。本文基于Linux 3.10,網(wǎng)卡驅(qū)動采用Intel的igb網(wǎng)卡舉例。