實(shí)時(shí)音視頻這種實(shí)時(shí)業(yè)務(wù)一般用udp傳輸數(shù)據(jù),其對網(wǎng)絡(luò)性能是非常敏感的,在實(shí)戰(zhàn)中,經(jīng)常需要測試當(dāng)前端到端或端到云的網(wǎng)絡(luò)性能。在這里我們討論一下網(wǎng)絡(luò)性能測試中所涉及到指標(biāo),技術(shù)和相關(guān)工具,以及如何編寫自己的網(wǎng)絡(luò)性能測試工具。
性能指標(biāo)
先給出幾個(gè)比較重要的指標(biāo)的定義以及它們的意義。
- 帶寬(吞吐量)
單位時(shí)間內(nèi)傳輸?shù)臄?shù)據(jù)量,單位通常是每秒比特?cái)?shù),記作bps;
帶寬反映了網(wǎng)絡(luò)的傳輸能力,越大越好;
- 丟包
數(shù)據(jù)包丟失個(gè)數(shù),等于“發(fā)送數(shù)據(jù)包數(shù)” - “接受數(shù)據(jù)包數(shù)”;
丟包反映了網(wǎng)絡(luò)可靠性,越小越好;
- 時(shí)延
數(shù)據(jù)包從發(fā)送開始到接收到該數(shù)據(jù)所耗費(fèi)的時(shí)間,單位通常是毫秒;
時(shí)延反映了網(wǎng)絡(luò)的速度,越小越好;
- 抖動(dòng)
指時(shí)延的變化,即兩個(gè)數(shù)據(jù)包時(shí)延的差值;
抖動(dòng)反映了網(wǎng)絡(luò)的穩(wěn)定性,越小越好;
- 亂序
指接收到的數(shù)據(jù)包順序和發(fā)送順序不一致的次數(shù);
亂序反映了網(wǎng)絡(luò)的穩(wěn)定性,越小越好;
當(dāng)亂序比較嚴(yán)重時(shí),丟包也會比較嚴(yán)重,所以一般都以丟包指標(biāo)為主,忽略亂序指標(biāo);
測試工具
網(wǎng)上有很多測試網(wǎng)絡(luò)性能的工具,如果它們能滿足需求的話,就不用自己再造輪子了。
ping
ping是最常見的,幾乎在所有的OS上都有它的存在。 其工作原理如圖

- Local發(fā)送的數(shù)據(jù)包,Remote收到數(shù)據(jù)包后原樣發(fā)回來;
- 數(shù)據(jù)包里包含有序號和時(shí)間戳信息;
- 序號用于判斷是否丟包;
- 時(shí)間戳用于計(jì)算來回時(shí)延(圖中藍(lán)色部分),它等于接收時(shí)間減去數(shù)據(jù)包時(shí)間戳;
不同OS的ping命令選項(xiàng)可能會略有差別,以Mac OSX的ping為例
$ping -s 1024 192.168.1.100
PING www.microsoft.com (23.42.217.205): 1024 data bytes
1032 bytes from 23.42.217.205: icmp_seq=0 ttl=49 time=83.883 ms
1032 bytes from 23.42.217.205: icmp_seq=1 ttl=49 time=77.958 ms
1032 bytes from 23.42.217.205: icmp_seq=2 ttl=49 time=80.053 ms
1032 bytes from 23.42.217.205: icmp_seq=3 ttl=49 time=78.244 ms
1032 bytes from 23.42.217.205: icmp_seq=4 ttl=49 time=77.937 ms

^C
--- 192.168.1.100 ping statistics ---
30 packets transmitted, 29 packets received, 3.3% packet loss
round-trip min/avg/max/stddev = 77.843/95.375/141.314/19.167 ms其中 -s 1024 指示包的大小為1024字節(jié);從ping結(jié)果可以看出,發(fā)送了30個(gè)包,收到29個(gè)包,3.3%的丟包率,最小時(shí)延77.843毫秒,最大時(shí)延141.314毫秒,平均時(shí)延95.375毫秒,時(shí)延的標(biāo)準(zhǔn)差19.167。另外,ping用的是ICMP協(xié)議,網(wǎng)絡(luò)對ICMP協(xié)議處理性能,可能跟UDP或TCP是不一樣的,所以測試結(jié)果只能做為參考。
小結(jié):ping的優(yōu)點(diǎn)是簡單便捷,可以測試時(shí)延和丟包,缺點(diǎn)是無法測試帶寬。
iperf
iperf功能功能強(qiáng)一些,可以測帶寬,丟包,抖動(dòng), 但是測不了時(shí)延。它的工作原理如圖:

從圖中可以看出iperf是單向發(fā)數(shù)據(jù)包,并不會像ping一樣接收方把數(shù)據(jù)包發(fā)回給發(fā)送方,所以它是測不了時(shí)延,但能測試抖動(dòng)。抖動(dòng)等于接收時(shí)間間隔(綠色長度)減去發(fā)送時(shí)間間隔(藍(lán)色長度,即timestamp2-timestamp1)。
下面是一個(gè)例子。
服務(wù)端:
$iperf -u -s -p 12345 -i 1 -w 1000000
------------------------------------------------------------
Server listening on UDP port 12345
Receiving 1470 byte datagrams
UDP buffer size: 977 KByte
------------------------------------------------------------
客戶端:
$ iperf -u -c 127.0.0.1 -p 12345 -i 1 -t 5 -b 16K -l 62
------------------------------------------------------------
Client connecting to 127.0.0.1, UDP port 12345
Sending 62 byte datagrams
UDP buffer size: 9.00 KByte (default)
------------------------------------------------------------
[ 4] local 127.0.0.1 port 59805 connected with 127.0.0.1 port 12345
[ ID] Interval Transfer Bandwidth
[ 4] 0.0- 1.0 sec 2.00 KBytes 16.4 Kbits/sec
[ 4] 1.0- 2.0 sec 1.94 KBytes 15.9 Kbits/sec
[ 4] 2.0- 3.0 sec 1.94 KBytes 15.9 Kbits/sec
[ 4] 3.0- 4.0 sec 1.94 KBytes 15.9 Kbits/sec
[ 4] 4.0- 5.0 sec 2.00 KBytes 16.4 Kbits/sec
[ 4] 0.0- 5.1 sec 9.87 KBytes 16.0 Kbits/sec
[ 4] Sent 163 datagrams
[ 4] Server Report:
[ 4] 0.0- 5.1 sec 9.87 KBytes 16.0 Kbits/sec 0.046 ms 0/ 163 (0%)
其中 -b 16K 指定了帶寬參數(shù)。測試結(jié)果為丟包0個(gè),平均抖動(dòng)為0.046毫秒。
自己開發(fā)
or(unsigned second = 0; second < test_seconds; second++)
{
for(unsigned ui = 0; ui < 8; ui++)
{
sendto 1024 bytes;
}
msleep(1000);
}
從上面可以看出,ping和iperf各有優(yōu)缺點(diǎn),通常需要兩者組合才能滿足我們的需求。有時(shí)候現(xiàn)有工具不能滿足實(shí)際應(yīng)用的需求,比如說完全模擬實(shí)際業(yè)務(wù)環(huán)境或者在產(chǎn)品里集成測試功能,這時(shí)候就需要發(fā)揮“自己動(dòng)手,豐衣足食”的精神,造出一個(gè)適合自己用的輪子來。我們這里只討論關(guān)鍵點(diǎn)之一:如何勻速發(fā)送數(shù)據(jù)。
我們以設(shè)定發(fā)送包長為1024字節(jié),帶寬為64kbps為例子,討論發(fā)送數(shù)據(jù)的實(shí)現(xiàn)方案。
發(fā)送數(shù)據(jù)最簡單的方法就是,起一個(gè)線程,每秒直接發(fā)送完當(dāng)前秒的數(shù)據(jù),然后sleep一秒,再繼續(xù)發(fā)送,如下:
這種方法比較簡單,但是因?yàn)榘l(fā)送數(shù)據(jù)是需要花費(fèi)時(shí)間的,假如發(fā)送64Kbit花費(fèi)了5毫秒,實(shí)際發(fā)送碼率(帶寬)為64/1005≈63.68Kbps,比設(shè)定值低一些。把發(fā)送時(shí)間考慮在內(nèi),第2個(gè)改進(jìn)后的代碼版本如下:
for (unsigned second = 0; second < test_seconds; second++)
{
unsigned ts_start = gettimestamp();
for (unsigned ui = 0; ui < 8; ui++)
{
sendto 1024 bytes;
}
unsigned elapsed = gettimestamp() - ts_start;
msleep(1000-elapsed);
}
從大尺度上看,這個(gè)版本確實(shí)會按設(shè)定帶寬發(fā)送數(shù)據(jù),但從小的的時(shí)間片上看,其瞬時(shí)發(fā)送速率是非常高的。假如發(fā)送64Kbit花費(fèi)了5毫秒,則瞬時(shí)速率為 64*1000/5=12800Kbps,是設(shè)定值的20倍。這種瞬時(shí)高發(fā)送速率可能會導(dǎo)致網(wǎng)絡(luò)中某些路由器或交換機(jī)來不及處理而大量丟包。所以我們繼續(xù)改進(jìn),在每發(fā)送一個(gè)包時(shí)check是否發(fā)送太快,如果發(fā)送太快的話就sleep一下緩一緩。改進(jìn)后的第三個(gè)版本如下:
uint64_t sent_bytes = 0;
unsigned kick_time = gettimestamp();
for (unsigned second = 0; second < test_seconds; second++)
{
sendto 1024 bytes; sent_bytes += 1024;
unsigned elapsed = gettimestamp() - kick_time;
unsigned normal = sent_bytes * 1000 * 8 / (64*1000);
if (normal > elapsed)
{
msleep(normal-elapsed);
}
}
這個(gè)版本基本能夠按照設(shè)定值勻速發(fā)送數(shù)據(jù)了。當(dāng)然,它還不是最完美的,當(dāng)設(shè)定帶寬很高而包長很小時(shí),會導(dǎo)致太多的check,占用太多CPU。這里就不繼續(xù)改進(jìn)了,有興趣的看官可以自己實(shí)現(xiàn)之。