那什麼鬼 -- network Incast 問題

Posted by summer on August 27, 2021

Incast 問題指的是在多對一通訊模式下,眾多 server 所傳送的資料同一時間進入 switch ,造成網路的極度壅塞。

由於 TCP 重送機制,server 未收到 ack 時會重送資料,這會使發生 incast 問題時的網路狀況雪上加霜,這是災難性的。

解決方法有幾種

  • 增加 switch 的 buffer
  • 減少 TCP 的 RTO (Retransmission TimeOut) 能有效提高吞吐量

對於 data center 目前有針對 data center 的 tcp 版本