網(wǎng)絡(luò)socket編程指南 (轉(zhuǎn)貼)1
http://www.chinaunix.net 作者:流浪者 發(fā)表于:2003-04-11 17:09:07
Beej網(wǎng)絡(luò)socket編程指南
--------------------------------------------------------------------------------
介紹
Socket 編程讓你沮喪嗎?從man pages中很難得到有用的信息嗎?你想跟上時代去編Internet相關(guān)的程序,但是為你在調(diào)用 connect() 前的bind() 的結(jié)構(gòu)而不知所措?等等…
好在我已經(jīng)將這些事完成了,我將和所有人共享我的知識了。如果你了解 C 語言并想穿過網(wǎng)絡(luò)編程的沼澤,那么你來對地方了。
--------------------------------------------------------------------------------
讀者對象
這個文檔是一個指南,而不是參考書。如果你剛開始 socket 編程并想找一本入門書,那么你是我的讀者。但這不是一本完全的 socket 編程書。
--------------------------------------------------------------------------------
平臺和編譯器
這篇文檔中的大多數(shù)代碼都在 Linux 平臺PC 上用 GNU 的 gcc 成功編譯過。而且它們在 HPUX平臺 上用 gcc 也成功編譯過。但是注意,并不是每個代碼片段都獨立測試過。
--------------------------------------------------------------------------------
目錄:
1) 什么是套接字?
2) Internet 套接字的兩種類型
3) 網(wǎng)絡(luò)理論
4) 結(jié)構(gòu)體
5) 本機轉(zhuǎn)換
6) IP 地址和如何處理它們
7) socket()函數(shù)
8) bind()函數(shù)
9) connect()函數(shù)
10) listen()函數(shù)
11) accept()函數(shù)
12) send()和recv()函數(shù)
13) sendto()和recvfrom()函數(shù)
14) close()和shutdown()函數(shù)
15) getpeername()函數(shù)
16) gethostname()函數(shù)
17) 域名服務(wù)(DNS)
18) 客戶-服務(wù)器背景知識
19) 簡單的服務(wù)器
20) 簡單的客戶端
21) 數(shù)據(jù)報套接字Socket
22) 阻塞
23) select()--多路同步I/O
24) 參考資料
--------------------------------------------------------------------------------
什么是 socket?
你經(jīng)常聽到人們談?wù)撝?“socket”,或許你還不知道它的確切含義。現(xiàn)在讓我告訴你:它是使用 標準Unix 文件描述符 (file descriptor) 和其它程序通訊的方式。什么?你也許聽到一些Unix高手(hacker)這樣說過:“呀,Unix中的一切就是文件!”那個家伙也許正在說到一個事實:Unix 程序在執(zhí)行任何形式的 I/O 的時候,程序是在讀或者寫一個文件描述符。一個文件描述符只是一個和打開的文件相關(guān)聯(lián)的整數(shù)。但是(注意后面的話),這個文件可能是一個網(wǎng)絡(luò)連接,F(xiàn)IFO,管道,終端,磁盤上的文件或者什么其它的東西。Unix 中所有的東西就是文件!所以,你想和Internet上別的程序通訊的時候,你將要使用到文件描述符。你必須理解剛才的話。現(xiàn)在你腦海中或許冒出這樣的念頭:“那么我從哪里得到網(wǎng)絡(luò)通訊的文件描述符呢?”,這個問題無論如何我都要回答:你利用系統(tǒng)調(diào)用 socket(),它返回套接字描述符 (socket descriptor),然后你再通過它來進行send() 和 recv()調(diào)用。“但是...”,你可能有很大的疑惑,“如果它是個文件描述符,那么為什 么不用一般調(diào)用read()和write()來進行套接字通訊?”簡單的答案是:“你可以使用!”。詳細的答案是:“你可以,但是使用send()和recv()讓你更好的控制數(shù)據(jù)傳輸。”存在這樣一個情況:在我們的世界上,有很多種套接字。有DARPA Internet 地址 (Internet 套接字),本地節(jié)點的路徑名 (Unix套接字),CCITT X.25地址 (你可以將X.25 套接字完全忽略)。也許在你的Unix 機器上還有其它的。我們在這里只講第一種:Internet 套接字。
--------------------------------------------------------------------------------
Internet 套接字的兩種類型
什么意思?有兩種類型的Internet 套接字?是的。不,我在撒謊。其實還有很多,但是我可不想嚇著你。我們這里只講兩種。除了這些, 我打算另外介紹的 "Raw Sockets" 也是非常強大的,很值得查閱。
那么這兩種類型是什么呢?一種是"Stream Sockets"(流格式),另外一種是"Datagram Sockets"(數(shù)據(jù)包格式)。我們以后談到它們的時候也會用到 "SOCK_STREAM" 和 "SOCK_DGRAM"。數(shù)據(jù)報套接字有時也叫“無連接套接字”(如果你確實要連接的時候可以用connect()。) 流式套接字是可靠的雙向通訊的數(shù)據(jù)流。如果你向套接字按順序輸出“1,2”,那么它們將按順序“1,2”到達另一邊。它們是無錯誤的傳遞的,有自己的錯誤控制,在此不討論。
有什么在使用流式套接字?你可能聽說過 telnet,不是嗎?它就使用流式套接字。你需要你所輸入的字符按順序到達,不是嗎?同樣,WWW瀏覽器使用的 HTTP 協(xié)議也使用它們來下載頁面。實際上,當(dāng)你通過端口80 telnet 到一個 WWW 站點,然后輸入 “GET pagename” 的時候,你也可以得到 HTML 的內(nèi)容。為什么流式套接字可以達到高質(zhì)量的數(shù)據(jù)傳輸?這是因為它使用了“傳輸控制協(xié)議 (The Transmission Control Protocol)”,也叫 “TCP” (請參考 RFC-793 獲得詳細資料。)TCP 控制你的數(shù)據(jù)按順序到達并且沒有錯
誤。你也許聽到 “TCP” 是因為聽到過 “TCP/IP”。這里的 IP 是指“Internet 協(xié)議”(請參考 RFC-791。) IP 只是處理 Internet 路由而已。
那么數(shù)據(jù)報套接字呢?為什么它叫無連接呢?為什么它是不可靠的呢?有這樣的一些事實:如果你發(fā)送一個數(shù)據(jù)報,它可能會到達,它可能次序顛倒了。如果它到達,那么在這個包的內(nèi)部是無錯誤的。數(shù)據(jù)報也使用 IP 作路由,但是它不使用 TCP。它使用“用戶數(shù)據(jù)報協(xié)議 (User Datagram Protocol)”,也叫 “UDP” (請參考 RFC-768。)
為什么它們是無連接的呢?主要是因為它并不象流式套接字那樣維持一個連接。你只要建立一個包,構(gòu)造一個有目標信息的IP 頭,然后發(fā)出去。無需連接。它們通常使用于傳輸包-包信息。簡單的應(yīng)用程序有:tftp, bootp等等。
你也許會想:“假如數(shù)據(jù)丟失了這些程序如何正常工作?”我的朋友,每個程序在 UDP 上有自己的協(xié)議。例如,tftp 協(xié)議每發(fā)出的一個被接受到包,收到者必須發(fā)回一個包來說“我收到了!” (一個“命令正確應(yīng)答”也叫“ACK” 包)。如果在一定時間內(nèi)(例如5秒),發(fā)送方?jīng)]有收到應(yīng)答,它將重新發(fā)送,直到得到 ACK。這一ACK過程在實現(xiàn) SOCK_DGRAM 應(yīng)用程序的時候非常重要。
--------------------------------------------------------------------------------
網(wǎng)絡(luò)理論
既然我剛才提到了協(xié)議層,那么現(xiàn)在是討論網(wǎng)絡(luò)究竟如何工作和一些 關(guān)于 SOCK_DGRAM 包是如何建立的例子。當(dāng)然,你也可以跳過這一段, 如果你認為已經(jīng)熟悉的話。
現(xiàn)在是學(xué)習(xí)數(shù)據(jù)封裝 (Data Encapsulation) 的時候了!它非常非常重 要。它重要性重要到你在網(wǎng)絡(luò)課程學(xué)(圖1:數(shù)據(jù)封裝)習(xí)中無論如何也得也得掌握它。主要 的內(nèi)容是:一個包,先是被第一個協(xié)議(在這里是TFTP )在它的報頭(也許 是報尾)包裝(“封裝”),然后,整個數(shù)據(jù)(包括 TFTP 頭)被另外一個協(xié)議 (在這里是 UDP )封裝,然后下一個( IP ),一直重復(fù)下去,直到硬件(物理) 層( 這里是以太網(wǎng) )。
當(dāng)另外一臺機器接收到包,硬件先剝?nèi)ヒ蕴W(wǎng)頭,內(nèi)核剝?nèi)P和UDP 頭,TFTP程序再剝?nèi)FTP頭,最后得到數(shù)據(jù)。現(xiàn)在我們終于講到聲名狼藉的網(wǎng)絡(luò)分層模型 (Layered Network Model)。這種網(wǎng)絡(luò)模型在描述網(wǎng)絡(luò)系統(tǒng)上相對其它模型有很多優(yōu)點。例如, 你可以寫一個套接字程序而不用關(guān)心數(shù)據(jù)的物理傳輸(串行口,以太網(wǎng),連 接單元接口 (AUI) 還是其它介質(zhì)),因為底層的程序會為你處理它們。實際 的網(wǎng)絡(luò)硬件和拓撲對于程序員來說是透明的。
不說其它廢話了,我現(xiàn)在列出整個層次模型。如果你要參加網(wǎng)絡(luò)考試, 可一定要記住:
應(yīng)用層 (Application)
表示層 (Presentation)
會話層 (Session)
傳輸層(Transport)
網(wǎng)絡(luò)層(Network)
數(shù)據(jù)鏈路層(Data Link)
物理層(Physical)
物理層是硬件(串口,以太網(wǎng)等等)。應(yīng)用層是和硬件層相隔最遠的--它 是用戶和網(wǎng)絡(luò)交互的地方。
這個模型如此通用,如果你想,你可以把它作為修車指南。把它對應(yīng) 到 Unix,結(jié)果是:
應(yīng)用層(Application Layer) (telnet, ftp,等等)
傳輸層(Host-to-Host Transport Layer) (TCP, UDP)
Internet層(Internet Layer) (IP和路由)
網(wǎng)絡(luò)訪問層 (Network Access Layer) (網(wǎng)絡(luò)層,數(shù)據(jù)鏈路層和物理層)
現(xiàn)在,你可能看到這些層次如何協(xié)調(diào)來封裝原始的數(shù)據(jù)了。
看看建立一個簡單的數(shù)據(jù)包有多少工作?哎呀,你將不得不使用 "cat" 來建立數(shù)據(jù)包頭!這僅僅是個玩笑。對于流式套接字你要作的是 send() 發(fā) 送數(shù)據(jù)。對于數(shù)據(jù)報式套接字,你按照你選擇的方式封裝數(shù)據(jù)然后使用 sendto()。內(nèi)核將為你建立傳輸層和 Internet 層,硬件完成網(wǎng)絡(luò)訪問層。 這就是現(xiàn)代科技。
現(xiàn)在結(jié)束我們的網(wǎng)絡(luò)理論速成班。哦,忘記告訴你關(guān)于路由的事情了。 但是我不準備談它,如果你真的關(guān)心,那么參考 IP RFC。
--------------------------------------------------------------------------------
結(jié)構(gòu)體
終于談到編程了。在這章,我將談到被套接字用到的各種數(shù)據(jù)類型。 因為它們中的一些內(nèi)容很重要了。
首先是簡單的一個:socket描述符。它是下面的類型:
int
僅僅是一個常見的 int。
從現(xiàn)在起,事情變得不可思議了,而你所需做的就是繼續(xù)看下去。注 意這樣的事實:有兩種字節(jié)排列順序:重要的字節(jié) (有時叫 "octet",即八 位位組) 在前面,或者不重要的字節(jié)在前面。前一種叫“網(wǎng)絡(luò)字節(jié)順序 (Network Byte Order)”。有些機器在內(nèi)部是按照這個順序儲存數(shù)據(jù),而另外 一些則不然。當(dāng)我說某數(shù)據(jù)必須按照 NBO 順序,那么你要調(diào)用函數(shù)(例如 htons() )來將它從本機字節(jié)順序 (Host Byte Order) 轉(zhuǎn)換過來。如果我沒有 提到 NBO, 那么就讓它保持本機字節(jié)順序。
我的第一個結(jié)構(gòu)(在這個技術(shù)手冊TM中)--struct sockaddr.。這個結(jié)構(gòu) 為許多類型的套接字儲存套接字地址信息:
struct sockaddr {
unsigned short sa_family; /* 地址家族, AF_xxx */
char sa_data[14]; /*14字節(jié)協(xié)議地址*/
};
sa_family 能夠是各種各樣的類型,但是在這篇文章中都是 "AF_INET"。 sa_data包含套接字中的目標地址和端口信息。這好像有點 不明智。
為了處理struct sockaddr,程序員創(chuàng)造了一個并列的結(jié)構(gòu): struct sockaddr_in ("in" 代表 "Internet"。)
struct sockaddr_in {
short int sin_family; /* 通信類型 */
unsigned short int sin_port; /* 端口 */
struct in_addr sin_addr; /* Internet 地址 */
unsigned char sin_zero[8]; /* 與sockaddr結(jié)構(gòu)的長度相同*/
};
用這個數(shù)據(jù)結(jié)構(gòu)可以輕松處理套接字地址的基本元素。注意 sin_zero (它被加入到這個結(jié)構(gòu),并且長度和 struct sockaddr 一樣) 應(yīng)該使用函數(shù) bzero() 或 memset() 來全部置零。 同時,這一重要的字節(jié),一個指向 sockaddr_in結(jié)構(gòu)體的指針也可以被指向結(jié)構(gòu)體sockaddr并且代替它。這 樣的話即使 socket() 想要的是 struct sockaddr *,你仍然可以使用 struct sockaddr_in,并且在最后轉(zhuǎn)換。同時,注意 sin_family 和 struct sockaddr 中的 sa_family 一致并能夠設(shè)置為 "AF_INET"。最后,sin_port和 sin_addr 必須是網(wǎng)絡(luò)字節(jié)順序 (Network Byte Order)!
你也許會反對道:"但是,怎么讓整個數(shù)據(jù)結(jié)構(gòu) struct in_addr sin_addr 按照網(wǎng)絡(luò)字節(jié)順序呢?" 要知道這個問題的答案,我們就要仔細的看一看這 個數(shù)據(jù)結(jié)構(gòu): struct in_addr, 有這樣一個聯(lián)合 (unions):
/* Internet 地址 (一個與歷史有關(guān)的結(jié)構(gòu)) */
struct in_addr {
unsigned long s_addr;
};
它曾經(jīng)是個最壞的聯(lián)合,但是現(xiàn)在那些日子過去了。如果你聲明 "ina" 是數(shù)據(jù)結(jié)構(gòu) struct sockaddr_in 的實例,那么 "ina.sin_addr.s_addr" 就儲 存4字節(jié)的 IP 地址(使用網(wǎng)絡(luò)字節(jié)順序)。如果你不幸的系統(tǒng)使用的還是恐 怖的聯(lián)合 struct in_addr ,你還是可以放心4字節(jié)的 IP 地址并且和上面 我說的一樣(這是因為使用了“#define”。)
--------------------------------------------------------------------------------
本機轉(zhuǎn)換
我們現(xiàn)在到了新的章節(jié)。我們曾經(jīng)講了很多網(wǎng)絡(luò)到本機字節(jié)順序的轉(zhuǎn) 換,現(xiàn)在可以實踐了!
你能夠轉(zhuǎn)換兩種類型: short (兩個字節(jié))和 long (四個字節(jié))。這個函 數(shù)對于變量類型 unsigned 也適用。假設(shè)你想將 short 從本機字節(jié)順序轉(zhuǎn) 換為網(wǎng)絡(luò)字節(jié)順序。用 "h" 表示 "本機 (host)",接著是 "to",然后用 "n" 表 示 "網(wǎng)絡(luò) (network)",最后用 "s" 表示 "short": h-to-n-s, 或者 htons() ("Host to Network Short")。
太簡單了...
如果不是太傻的話,你一定想到了由"n","h","s",和 "l"形成的正確 組合,例如這里肯定沒有stolh() ("Short to Long Host") 函數(shù),不僅在這里 沒有,所有場合都沒有。但是這里有:
htons()--"Host to Network Short"
htonl()--"Host to Network Long"
ntohs()--"Network to Host Short"
ntohl()--"Network to Host Long"
現(xiàn)在,你可能想你已經(jīng)知道它們了。你也可能想:“如果我想改變 char 的順序要怎么辦呢?” 但是你也許馬上就想到,“用不著考慮的”。你也許 會想到:我的 68000 機器已經(jīng)使用了網(wǎng)絡(luò)字節(jié)順序,我沒有必要去調(diào)用 htonl() 轉(zhuǎn)換 IP 地址。你可能是對的,但是當(dāng)你移植你的程序到別的機器 上的時候,你的程序?qū)⑹ ?梢浦残裕∵@里是 Unix 世界!記住:在你 將數(shù)據(jù)放到網(wǎng)絡(luò)上的時候,確信它們是網(wǎng)絡(luò)字節(jié)順序的。
最后一點:為什么在數(shù)據(jù)結(jié)構(gòu) struct sockaddr_in 中, sin_addr 和 sin_port 需要轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)順序,而sin_family 需不需要呢? 答案是: sin_addr 和 sin_port 分別封裝在包的 IP 和 UDP 層。因此,它們必須要 是網(wǎng)絡(luò)字節(jié)順序。但是 sin_family 域只是被內(nèi)核 (kernel) 使用來決定在數(shù) 據(jù)結(jié)構(gòu)中包含什么類型的地址,所以它必須是本機字節(jié)順序。同時, sin_family 沒有發(fā)送到網(wǎng)絡(luò)上,它們可以是本機字節(jié)順序。
--------------------------------------------------------------------------------
IP 地址和如何處理它們
現(xiàn)在我們很幸運,因為我們有很多的函數(shù)來方便地操作 IP 地址。沒有 必要用手工計算它們,也沒有必要用"<<"操作來儲存成長整字型。 首先,假設(shè)你已經(jīng)有了一個sockaddr_in結(jié)構(gòu)體ina,你有一個IP地 址"132.241.5.10"要儲存在其中,你就要用到函數(shù)inet_addr(),將IP地址從 點數(shù)格式轉(zhuǎn)換成無符號長整型。使用方法如下:
ina.sin_addr.s_addr = inet_addr("132.241.5.10");
注意,inet_addr()返回的地址已經(jīng)是網(wǎng)絡(luò)字節(jié)格式,所以你無需再調(diào)用 函數(shù)htonl()。
我們現(xiàn)在發(fā)現(xiàn)上面的代碼片斷不是十分完整的,因為它沒有錯誤檢查。 顯而易見,當(dāng)inet_addr()發(fā)生錯誤時返回-1。記住這些二進制數(shù)字?(無符 號數(shù))-1僅僅和IP地址255.255.255.255相符合!這可是廣播地址!大錯特 錯!記住要先進行錯誤檢查。
好了,現(xiàn)在你可以將IP地址轉(zhuǎn)換成長整型了。有沒有其相反的方法呢? 它可以將一個in_addr結(jié)構(gòu)體輸出成點數(shù)格式?這樣的話,你就要用到函數(shù) inet_ntoa()("ntoa"的含義是"network to ascii"),就像這樣:
printf("%s",inet_ntoa(ina.sin_addr));
它將輸出IP地址。需要注意的是inet_ntoa()將結(jié)構(gòu)體in-addr作為一 個參數(shù),不是長整形。同樣需要注意的是它返回的是一個指向一個字符的 指針。它是一個由inet_ntoa()控制的靜態(tài)的固定的指針,所以每次調(diào)用 inet_ntoa(),它就將覆蓋上次調(diào)用時所得的IP地址。例如:
char *a1, *a2;
.
.
a1 = inet_ntoa(ina1.sin_addr); /* 這是198.92.129.1 */
a2 = inet_ntoa(ina2.sin_addr); /* 這是132.241.5.10 */
printf("address 1: %s\n",a1);
printf("address 2: %s\n",a2);
輸出如下:
address 1: 132.241.5.10
address 2: 132.241.5.10
假如你需要保存這個IP地址,使用strcopy()函數(shù)來指向你自己的字符 指針。
上面就是關(guān)于這個主題的介紹。稍后,你將學(xué)習(xí)將一個類 似"wintehouse.gov"的字符串轉(zhuǎn)換成它所對應(yīng)的IP地址(查閱域名服務(wù),稍 后)。
只有注冊用戶登錄后才能發(fā)表評論。 | ||
【推薦】100%開源!大型工業(yè)跨平臺軟件C++源碼提供,建模,組態(tài)!
![]() |
||
網(wǎng)站導(dǎo)航:
博客園
IT新聞
BlogJava
博問
Chat2DB
管理
|
||
|