實時音視頻這種實時業(yè)務(wù)一般用udp傳輸數(shù)據(jù),其對網(wǎng)絡(luò)性能是非常敏感的,在實戰(zhàn)中,經(jīng)常需要測試當(dāng)前端到端或端到云的網(wǎng)絡(luò)性能。在這里我們討論一下網(wǎng)絡(luò)性能測試中所涉及到指標(biāo),技術(shù)和相關(guān)工具,以及如何編寫自己的網(wǎng)絡(luò)性能測試工具。
性能指標(biāo)
先給出幾個比較重要的指標(biāo)的定義以及它們的意義。
- 帶寬(吞吐量)
單位時間內(nèi)傳輸?shù)臄?shù)據(jù)量,單位通常是每秒比特數(shù),記作bps;
帶寬反映了網(wǎng)絡(luò)的傳輸能力,越大越好;
- 丟包
數(shù)據(jù)包丟失個數(shù),等于“發(fā)送數(shù)據(jù)包數(shù)” - “接受數(shù)據(jù)包數(shù)”;
丟包反映了網(wǎng)絡(luò)可靠性,越小越好;
- 時延
數(shù)據(jù)包從發(fā)送開始到接收到該數(shù)據(jù)所耗費的時間,單位通常是毫秒;
時延反映了網(wǎng)絡(luò)的速度,越小越好;
- 抖動
指時延的變化,即兩個數(shù)據(jù)包時延的差值;
抖動反映了網(wǎng)絡(luò)的穩(wěn)定性,越小越好;
- 亂序
指接收到的數(shù)據(jù)包順序和發(fā)送順序不一致的次數(shù);
亂序反映了網(wǎng)絡(luò)的穩(wěn)定性,越小越好;
當(dāng)亂序比較嚴(yán)重時,丟包也會比較嚴(yán)重,所以一般都以丟包指標(biāo)為主,忽略亂序指標(biāo);
測試工具
網(wǎng)上有很多測試網(wǎng)絡(luò)性能的工具,如果它們能滿足需求的話,就不用自己再造輪子了。
ping
ping是最常見的,幾乎在所有的OS上都有它的存在。 其工作原理如圖

- Local發(fā)送的數(shù)據(jù)包,Remote收到數(shù)據(jù)包后原樣發(fā)回來;
- 數(shù)據(jù)包里包含有序號和時間戳信息;
- 序號用于判斷是否丟包;
- 時間戳用于計算來回時延(圖中藍色部分),它等于接收時間減去數(shù)據(jù)包時間戳;
不同OS的ping命令選項可能會略有差別,以Mac OSX的ping為例
$ping -s 1024 192.168.1.100
PING www.microsoft.com (23.42.217.205): 1024 data bytes
1032 bytes from 23.42.217.205: icmp_seq=0 ttl=49 time=83.883 ms
1032 bytes from 23.42.217.205: icmp_seq=1 ttl=49 time=77.958 ms
1032 bytes from 23.42.217.205: icmp_seq=2 ttl=49 time=80.053 ms
1032 bytes from 23.42.217.205: icmp_seq=3 ttl=49 time=78.244 ms
1032 bytes from 23.42.217.205: icmp_seq=4 ttl=49 time=77.937 ms

^C
--- 192.168.1.100 ping statistics ---
30 packets transmitted, 29 packets received, 3.3% packet loss
round-trip min/avg/max/stddev = 77.843/95.375/141.314/19.167 ms其中 -s 1024 指示包的大小為1024字節(jié);從ping結(jié)果可以看出,發(fā)送了30個包,收到29個包,3.3%的丟包率,最小時延77.843毫秒,最大時延141.314毫秒,平均時延95.375毫秒,時延的標(biāo)準(zhǔn)差19.167。另外,ping用的是ICMP協(xié)議,網(wǎng)絡(luò)對ICMP協(xié)議處理性能,可能跟UDP或TCP是不一樣的,所以測試結(jié)果只能做為參考。
小結(jié):ping的優(yōu)點是簡單便捷,可以測試時延和丟包,缺點是無法測試帶寬。
iperf
iperf功能功能強一些,可以測帶寬,丟包,抖動, 但是測不了時延。它的工作原理如圖:

從圖中可以看出iperf是單向發(fā)數(shù)據(jù)包,并不會像ping一樣接收方把數(shù)據(jù)包發(fā)回給發(fā)送方,所以它是測不了時延,但能測試抖動。抖動等于接收時間間隔(綠色長度)減去發(fā)送時間間隔(藍色長度,即timestamp2-timestamp1)。
下面是一個例子。
服務(wù)端:
$iperf -u -s -p 12345 -i 1 -w 1000000
------------------------------------------------------------
Server listening on UDP port 12345
Receiving 1470 byte datagrams
UDP buffer size: 977 KByte
------------------------------------------------------------
客戶端:
$ iperf -u -c 127.0.0.1 -p 12345 -i 1 -t 5 -b 16K -l 62
------------------------------------------------------------
Client connecting to 127.0.0.1, UDP port 12345
Sending 62 byte datagrams
UDP buffer size: 9.00 KByte (default)
------------------------------------------------------------
[ 4] local 127.0.0.1 port 59805 connected with 127.0.0.1 port 12345
[ ID] Interval Transfer Bandwidth
[ 4] 0.0- 1.0 sec 2.00 KBytes 16.4 Kbits/sec
[ 4] 1.0- 2.0 sec 1.94 KBytes 15.9 Kbits/sec
[ 4] 2.0- 3.0 sec 1.94 KBytes 15.9 Kbits/sec
[ 4] 3.0- 4.0 sec 1.94 KBytes 15.9 Kbits/sec
[ 4] 4.0- 5.0 sec 2.00 KBytes 16.4 Kbits/sec
[ 4] 0.0- 5.1 sec 9.87 KBytes 16.0 Kbits/sec
[ 4] Sent 163 datagrams
[ 4] Server Report:
[ 4] 0.0- 5.1 sec 9.87 KBytes 16.0 Kbits/sec 0.046 ms 0/ 163 (0%)
其中 -b 16K 指定了帶寬參數(shù)。測試結(jié)果為丟包0個,平均抖動為0.046毫秒。
自己開發(fā)
or(unsigned second = 0; second < test_seconds; second++)
{
for(unsigned ui = 0; ui < 8; ui++)
{
sendto 1024 bytes;
}
msleep(1000);
}
從上面可以看出,ping和iperf各有優(yōu)缺點,通常需要兩者組合才能滿足我們的需求。有時候現(xiàn)有工具不能滿足實際應(yīng)用的需求,比如說完全模擬實際業(yè)務(wù)環(huán)境或者在產(chǎn)品里集成測試功能,這時候就需要發(fā)揮“自己動手,豐衣足食”的精神,造出一個適合自己用的輪子來。我們這里只討論關(guān)鍵點之一:如何勻速發(fā)送數(shù)據(jù)。
我們以設(shè)定發(fā)送包長為1024字節(jié),帶寬為64kbps為例子,討論發(fā)送數(shù)據(jù)的實現(xiàn)方案。
發(fā)送數(shù)據(jù)最簡單的方法就是,起一個線程,每秒直接發(fā)送完當(dāng)前秒的數(shù)據(jù),然后sleep一秒,再繼續(xù)發(fā)送,如下:
這種方法比較簡單,但是因為發(fā)送數(shù)據(jù)是需要花費時間的,假如發(fā)送64Kbit花費了5毫秒,實際發(fā)送碼率(帶寬)為64/1005≈63.68Kbps,比設(shè)定值低一些。把發(fā)送時間考慮在內(nèi),第2個改進后的代碼版本如下:
for (unsigned second = 0; second < test_seconds; second++)
{
unsigned ts_start = gettimestamp();
for (unsigned ui = 0; ui < 8; ui++)
{
sendto 1024 bytes;
}
unsigned elapsed = gettimestamp() - ts_start;
msleep(1000-elapsed);
}
從大尺度上看,這個版本確實會按設(shè)定帶寬發(fā)送數(shù)據(jù),但從小的的時間片上看,其瞬時發(fā)送速率是非常高的。假如發(fā)送64Kbit花費了5毫秒,則瞬時速率為 64*1000/5=12800Kbps,是設(shè)定值的20倍。這種瞬時高發(fā)送速率可能會導(dǎo)致網(wǎng)絡(luò)中某些路由器或交換機來不及處理而大量丟包。所以我們繼續(xù)改進,在每發(fā)送一個包時check是否發(fā)送太快,如果發(fā)送太快的話就sleep一下緩一緩。改進后的第三個版本如下:
uint64_t sent_bytes = 0;
unsigned kick_time = gettimestamp();
for (unsigned second = 0; second < test_seconds; second++)
{
sendto 1024 bytes; sent_bytes += 1024;
unsigned elapsed = gettimestamp() - kick_time;
unsigned normal = sent_bytes * 1000 * 8 / (64*1000);
if (normal > elapsed)
{
msleep(normal-elapsed);
}
}
這個版本基本能夠按照設(shè)定值勻速發(fā)送數(shù)據(jù)了。當(dāng)然,它還不是最完美的,當(dāng)設(shè)定帶寬很高而包長很小時,會導(dǎo)致太多的check,占用太多CPU。這里就不繼續(xù)改進了,有興趣的看官可以自己實現(xiàn)之。