欧美h视频在线,久久久精品tv,欧美一级日韩一级

使用 SCTP 優(yōu)化網(wǎng)絡

轉載自:http://www.ibm.com/developerworks/cn/linux/l-sctp/

SCTP 是在 IP 網(wǎng)絡上使用的一種可靠的通用傳輸層協(xié)議。盡管 SCTP 協(xié)議最初是為發(fā)送電話信號而設計的（RFC 2960），但帶來了一個意外的收獲：它通過借鑒 UDP 的優(yōu)點解決了 TCP 的某些局限。SCTP 提供的特性使套接字初始化的可用性、可靠性和安全性都得以提高。（圖 1 給出了 IP 堆棧的層次化架構。）

圖 1. IP 棧的層次化架構

本文簡要介紹了 Linux 2.6 內核中 SCTP 的概念，重點介紹了一些高級特性（例如多宿主和多流），并且給出了服務器和客戶機的部分代碼片斷（并給出了一個可以獲得更多代碼的 URL），從而展示了這種協(xié)議提供多流的能力。

下面讓我們開始介紹 IP 堆棧的內容。

IP 堆棧

Internet 協(xié)議套件被劃分成幾層；每層都提供特定功能，如圖 1 所示。

自下而上：

鏈路層（link layer） 提供了通信介質的物理接口（例如以太網(wǎng)設備）。
網(wǎng)絡層（network layer） 負責管理網(wǎng)絡中的報文移動，具體來說就是確保報文都到達自己的目標（也稱為路由）。
傳輸層（transport layer） 為應用層控制了報文在兩臺主機之間的流動。它還代表通信的應用程序端點，稱為 端口（port）。
最后，應用層（application layer） 對通過套接字傳遞數(shù)據(jù)具有深刻的意義。這些數(shù)據(jù)可能包括通過簡單郵件傳輸協(xié)議（Simple Mail Transport Protocol，SMTP）發(fā)送的 e-mail 消息，或通過超文本傳輸協(xié)議（Hypertext Transport Protocol，HTTP）呈現(xiàn)的 Web 頁面。

所有應用層協(xié)議都使用套接字層作為與傳輸層協(xié)議之間的接口。Sockets API 是由 UC Berkeley 在 BSD UNIX® 操作系統(tǒng)上開發(fā)的。

在深入鉆研 SCTP 之前，讓我們首先簡單回顧一下傳統(tǒng)的傳輸層協(xié)議。

傳輸層協(xié)議

兩種最流行的傳輸層協(xié)議是傳輸控制協(xié)議（TCP）和用戶數(shù)據(jù)報協(xié)議（UDP）：

TCP 是一種可靠的協(xié)議，它可以確保有序地發(fā)送數(shù)據(jù)，并管理網(wǎng)絡中的擁塞問題。
UDP 是一種面向消息的協(xié)議，它不能確保有序地發(fā)送數(shù)據(jù)，也無法管理網(wǎng)絡擁塞的問題。

然而，UDP 是一種快速協(xié)議，可以保護自己傳輸?shù)南⒌倪吔纭?/p>

本文引出了另外一個選擇：SCTP。它提供了像 TCP 一樣可靠、有序地發(fā)送數(shù)據(jù)的功能，但卻以像 UDP 一樣面向消息的方式來進行操作，這可以保護消息邊界。SCTP 還提供了幾個高級特性：

多宿主（Multi-homing）
多流（Multi-streaming）
初始化保護（Initiation protection）
消息分幀（Message framing）
可配置的無序發(fā)送（Configurable unordered delivery）
平滑關閉（Graceful shutdown）

SCTP 的關鍵特性

SCTP 相對于傳統(tǒng)的傳輸層協(xié)議來說，兩個重要的增強是終端主機的多宿主和多流功能。

多宿主

多宿主 為應用程序提供了比 TCP 更高的可用性。多宿主主機就是一臺具有多個網(wǎng)絡接口的主機，因此可以通過多個 IP 地址來訪問這臺主機。在 TCP 中，連接（connection） 是指兩個端點之間的一個通道（在這種情況下，就是兩臺主機的網(wǎng)絡接口之間的一個套接字）。SCTP 引入了 聯(lián)合（association） 的概念，它也是存在于兩臺主機之間，但可以使用每臺主機上的多個接口進行協(xié)作。

圖 2 闡述了 TCP 連接與 SCTP 聯(lián)合之間的區(qū)別。

圖 2. TCP 連接與 SCTP 聯(lián)合

該圖的上面部分是 TCP 連接，每個主機都只包含一個網(wǎng)絡接口；連接是在每個客戶機和服務器之間的單個接口之間建立的。在建立連接時，就被綁定到了每個接口上。

在該圖的下面部分中，您可以看到這樣一個架構：每臺主機上都包含兩個網(wǎng)絡接口。通過獨立網(wǎng)絡提供了兩條路徑，一條是從接口 C0 到 S0，另外一條是從接口 C1 到 S1。在 SCTP 中，這兩條路徑可以合并到一個聯(lián)合中。

SCTP 負責使用內嵌的 heartbeat 機制來監(jiān)視聯(lián)合的路徑；在檢測到一條路徑失效時，協(xié)議就會通過另外一條路徑來發(fā)送通信數(shù)據(jù)。應用程序甚至都不必知道發(fā)生了故障恢復。

故障轉移也可以用于維護網(wǎng)絡應用程序的連通性。例如，讓我們來考慮一臺包含一個無線 802.11 接口和一個以太網(wǎng)接口的筆記本的例子。當筆記本放到固定的位置上時，我們傾向于使用高速的以太網(wǎng)接口（在 SCTP 中稱為 主地址（primary address））；但是在這個連接丟失時（例如離開了固定位置），連接可遷移到無線接口上。在返回固定位置時，以太網(wǎng)連接會被重新檢測到，通信就可以在這個接口上恢復。這是一種能提供更高的可用性和可靠性的強大機制。

多流

從某種意義上來講，SCTP 連接與 TCP 連接類似，不同之處只是 SCTP 能夠在一個聯(lián)合中支持多流機制。一個聯(lián)合中的所有流都是獨立的，但均與該聯(lián)合相關（請參見圖 3）。

圖 3. SCTP 聯(lián)合與流之間的關系

每個流都給定了一個流編號，它被編碼到 SCTP 報文中，通過聯(lián)合在網(wǎng)絡上傳送。多流非常重要，因為阻塞的流（例如等待重傳的流會導致報文的丟失）不會影響同一聯(lián)合中的其他流。這個問題統(tǒng)稱為 head-of-line blocking（對頭阻塞）。TCP 很容易出現(xiàn)這類阻塞問題。

多流如何在傳輸數(shù)據(jù)時提供更好的響應性呢？例如，HTTP 協(xié)議會在相同套接字上共享控制和數(shù)據(jù)。Web 客戶機從服務器上請求一個文件，服務器通過相同的連接將這個文件發(fā)回給客戶機。多流的 HTTP 服務器可以提供更好的交互能力，因為在聯(lián)合中各單獨的流上可以處理多個請求。這種功能可以并行化響應，盡管速度不一定會更快，但可以同時加載 HTML 和圖像映像，從而表現(xiàn)出更好的響應性。

多流處理是 SCTP 的一個重要特性，尤其是在協(xié)議的設計中考慮一些控制和數(shù)據(jù)的問題時更是如此。在 TCP 中，控制和數(shù)據(jù)通常都是通過相同的連接進行共享的，這可能會產(chǎn)生問題，因為控制報文可能會在數(shù)據(jù)報之后延時。如果控制和數(shù)據(jù)被劃分成單獨的流，控制數(shù)據(jù)就可以以一種更及時的方式進行處理，從而可以更好地利用可用資源。

初始化保護

TCP 和 SCTP 中對新連接的初始化是通過報文握手來完成的。在 TCP 中，這種機制稱為 三次握手（three-way handshake）。客戶機向服務器首先發(fā)送一個 SYN 報文（Synchronize 的簡寫），服務器使用一個 SYN-ACK 報文進行響應（Synchronize-Acknowledge）。最后，客戶機使用一個 ACK 報文確認已接收到報文（請參見圖 4）。

圖 4. TCP 和 STCP 握手使用的報文交換

當惡意客戶機使用虛假的源地址來偽造一個 IP 報文時，TCP 就會出現(xiàn)問題了，這會大量 TCP SYN 報文攻擊服務器。服務器在接收SYN 報文之前，要為連接分配資源，但是在大量產(chǎn)生 SYN 報文的情況下，最終會耗盡自己的資源，從而無法處理新的請求。這種情況就稱為 服務拒絕（Denial of Service）（DoS）攻擊。

SCTP 可以通過一種 4 次握手的機制并引入了 cookie 的概念來有效地防止這種攻擊的產(chǎn)生。在 SCTP 中，客戶機使用一個 INIT 報文發(fā)起一個連接。服務器使用一個 INIT-ACK 報文進行響應，其中就包括了 cookie（標識這個連接的惟一上下文）。客戶機然后就使用一個 COOKIE-ECHO 報文進行響應，其中包含了服務器所發(fā)送的 cookie。現(xiàn)在，服務器要為這個連接分配資源，并通過向客戶機發(fā)送一個 COOKIE-ACK 報文對其進行響應。

要解決使用這種 4 次握手機制解決延時數(shù)據(jù)移動的問題，SCTP 允許把數(shù)據(jù)包含到 COOKIE-ECHO 和 COOKIE-ACK 報文中。

消息分幀

使用消息分幀機制，就可以保護消息只在一個邊界內通過 socket 進行通信；這意味著如果客戶機向服務器先發(fā)送 100 個字節(jié)，然后又發(fā)送 50 個字節(jié)。那么服務器就會在兩次讀取操作中分別讀取到 100 個字節(jié)和 50 個字節(jié)。UDP 也是這樣進行操作，這對于面向消息的協(xié)議非常有益。

與此不同，TCP 是按照字節(jié)流的方式進行操作。如果沒有分幀機制，一端接收到的數(shù)據(jù)可能比另外一端發(fā)送的數(shù)據(jù)多或少（這會將一次寫操作劃分成多次操作，或者將多次寫操作合并到一個讀操作中）。這種行為需要在 TCP 之上進行操作的面向消息的協(xié)議可以在應用層中提供數(shù)據(jù)緩沖和消息分幀機制（這可能是一項復雜的任務）。

SCTP 在數(shù)據(jù)傳輸中提供了消息分幀功能。當一端對一個套接字執(zhí)行寫操作時，可確保對等端讀出的數(shù)據(jù)大小與此相同（請參見圖 5）。

圖 5. UDP/SCTP 中的消息分幀與面向字節(jié)流協(xié)議的比較

對于面向流的數(shù)據(jù)來說，例如音頻和視頻數(shù)據(jù)，可以沒有分幀機制。

可配置的無序發(fā)送

SCTP 中的消息的傳輸十分可靠，但未必是按照想要的次序來傳輸?shù)摹CP 可以確保數(shù)據(jù)是按照次序發(fā)送的（考慮到 TCP 是一種流協(xié)議，這是一件好事）。UDP 無法確保有序地發(fā)送數(shù)據(jù)。但是如果需要，您也可以在 SCTP 中配置流來接受無序的消息。

這種特性在面向消息的協(xié)議中可能非常有用，因為其中的消息都是獨立的，次序并不重要。另外，您可以在一個聯(lián)合中按照逐個流配置無序發(fā)送。

平滑關閉

TCP 和 SCTP 都是基于連接的協(xié)議，而 UDP 則是一種無連接的協(xié)議。TCP 和 SCTP 都需要在對等的兩端建立和拆除連接。SCTP 與 TCP 中關閉連接的不同之處在于 TCP 中連接的刪除是半關閉（half-close） 的。

圖 6 給出了 TCP 和 SCTP 的關閉序列。

圖 6. TCP 和 SCTP 的連接結束序列

在 TCP 中，一端可以關閉自己這端的 socket（這樣會導致發(fā)送一個 FIN 報文），但是仍然可以繼續(xù)接收數(shù)據(jù)。FIN 說明這個端點不會再發(fā)送數(shù)據(jù)，但是在這一端關閉自己這端的套接字之前，它一直可以繼續(xù)傳輸數(shù)據(jù)。應用程序很少使用這種半關閉狀態(tài)，因此 SCTP 的設計者就選擇放棄這種狀態(tài)，并將其替換成了一個顯式的終結序列。當一端關閉自己的套接字時（導致產(chǎn)生一個 SHUTDOWN原語），對等的兩端全部需要關閉，將來任何一端都不允許再進行數(shù)據(jù)的移動了。

多流的展示

現(xiàn)在您已經(jīng)了解了 SCTP 的基本特性了，接下來讓我們來看一下使用 C 編程語言編寫的一個樣例服務器和客戶機，并展示 SCTP 的多流特性。

這個例子開發(fā)了一個服務器，它實現(xiàn)了一種形式的日期查詢協(xié)議。這個傳統(tǒng)的服務器會在連接上來的客戶機上打印當前時間，但是對于 SCTP 來說，我們會在流 0 上打印本地時間，在流 1 上打印格林威治時間（GMT）。這個例子讓我們可以展示如何使用這些 API 來開發(fā)流通信。

圖 7 對整個過程進行了歸納，它不但從套接字 API 的角度展示了應用程序的流程，而且還從客戶機和服務器的角度介紹了它們之間的關系。

圖 7. 在多流日期查詢服務器和客戶機中使用的套接字函數(shù)

這些應用程序是在 GNU/Linux 操作系統(tǒng)上開發(fā)的，其內核版本是 2.6.11，并且包含了 Linux Kernel SCTP 項目（lksctp）。其中非標準的 socket 函數(shù)是在 lksctp 工具包中提供的，這個工具包可以從 SourceForge 上獲得。請參看參考資料中的鏈接。

daytime 服務器

清單 1 給出了這個多流 daytime 服務器的代碼。為了可讀性更好，我們在清單 1 中忽略了所有的錯誤檢查，但是這些展示錯誤檢查機制的代碼與其他 SCTP 套接字擴展一樣都可以通過給出的鏈接下載到。

清單 1. 使用多流機制為 SCTP 編寫的日期查詢服務器

int main()
{
  int listenSock, connSock, ret;
  struct sockaddr_in servaddr;
  char buffer[MAX_BUFFER+1];
  time_t currentTime;
  /* Create SCTP TCP-Style Socket */
  listenSock = socket( AF_INET, SOCK_STREAM, IPPROTO_SCTP );
  /* Accept connections from any interface */
  bzero( (void *)&servaddr, sizeof(servaddr) );
  servaddr.sin_family = AF_INET;
  servaddr.sin_addr.s_addr = htonl( INADDR_ANY );
  servaddr.sin_port = htons(MY_PORT_NUM);
  /* Bind to the wildcard address (all) and MY_PORT_NUM */
  ret = bind( listenSock,
               (struct sockaddr *)&servaddr, sizeof(servaddr) );
  /* Place the server socket into the listening state */
  listen( listenSock, 5 );
  /* Server loop... */
  while( 1 ) {
    /* Await a new client connection */
    connSock = accept( listenSock,
                        (struct sockaddr *)NULL, (int *)NULL );
    /* New client socket has connected */
    /* Grab the current time */
    currentTime = time(NULL);
    /* Send local time on stream 0 (local time stream) */
    snprintf( buffer, MAX_BUFFER, "%s\n", ctime(&currentTime) );
    ret = sctp_sendmsg( connSock,
                          (void *)buffer, (size_t)strlen(buffer),
                          NULL, 0, 0, 0, LOCALTIME_STREAM, 0, 0 );
    /* Send GMT on stream 1 (GMT stream) */
    snprintf( buffer, MAX_BUFFER, "%s\n",
               asctime( gmtime( &currentTime ) ) );
    ret = sctp_sendmsg( connSock,
                          (void *)buffer, (size_t)strlen(buffer),
                          NULL, 0, 0, 0, GMT_STREAM, 0, 0 );
    /* Close the client connection */
    close( connSock );
  }
  return 0;
}

清單 1 中的服務器首先創(chuàng)建服務器的套接字（使用 IPPROTO_SCTP 來創(chuàng)建一個 SCTP 的一對一的套接字）。然后創(chuàng)建一個 sockaddr 結構，指定這個連接可以從任何本地接口上創(chuàng)建（使用通配符地址 INADDR_ANY）。我們使用 bind 調用將這個 sockaddr 結構綁定到 socket 上，然后將服務器套接字設置成監(jiān)聽狀態(tài)。現(xiàn)在就可以接收到達的連接了。

注意 SCTP 使用了很多與 TCP 和 UDP 相同的套接字 API。在 lksctp 開發(fā)工具中還提供了其他一些 API 函數(shù)（請參看參考資料）。

在服務器的循環(huán)中，一直等待新客戶機的連接請求。在從 accept 函數(shù)返回時，會使用 connSock socket 標識新客戶機的連接。我們使用 time 函數(shù)來獲取當前時間，然后使用 snprintf 將其轉換成字符串。使用 sctp_sendmsg 函數(shù)（一個非標準的 socket 調用），可以通過指定特定的流程（LOCALTIME_STREAM，將這個字符串發(fā)送給客戶機。當發(fā)送本地時間字符串之后，我們將使用 GMT 表示的當前時間轉換成一個字符串，然后將其發(fā)送到流 GMT_STREAM 上。

現(xiàn)在，日期查詢服務器已經(jīng)完成了自己的職責，因此我們就可以關閉這個 socket，然后等待一個新的客戶機連接。一切都非常簡單，對嗎？現(xiàn)在讓我們來看一下日期查詢客戶機是如何處理多流的。

日期查詢客戶機

多流客戶機如清單 2 所示。

清單 2. 使用多流機制為 SCTP 編寫的日期查詢客戶機

int main()
{
  int connSock, in, i, flags;
  struct sockaddr_in servaddr;
  struct sctp_sndrcvinfo sndrcvinfo;
  struct sctp_event_subscribe events;
  char buffer[MAX_BUFFER+1];
  /* Create an SCTP TCP-Style Socket */
  connSock = socket( AF_INET, SOCK_STREAM, IPPROTO_SCTP );
  /* Specify the peer endpoint to which we'll connect */
  bzero( (void *)&servaddr, sizeof(servaddr) );
  servaddr.sin_family = AF_INET;
  servaddr.sin_port = htons(MY_PORT_NUM);
  servaddr.sin_addr.s_addr = inet_addr( "127.0.0.1" );
  /* Connect to the server */
  connect( connSock, (struct sockaddr *)&servaddr, sizeof(servaddr) );
  /* Enable receipt of SCTP Snd/Rcv Data via sctp_recvmsg */
  memset( (void *)&events, 0, sizeof(events) );
  events.sctp_data_io_event = 1;
  setsockopt( connSock, SOL_SCTP, SCTP_EVENTS,
               (const void *)&events, sizeof(events) );
  /* Expect two messages from the peer */
  for (i = 0 ; i < 2 ; i++) {
    in = sctp_recvmsg( connSock, (void *)buffer, sizeof(buffer),
                        (struct sockaddr *)NULL, 0,
                        &sndrcvinfo, &flags );
    /* Null terminate the incoming string */
    buffer[in] = 0;
    if        (sndrcvinfo.sinfo_stream == LOCALTIME_STREAM) {
      printf("(Local) %s\n", buffer);
    } else if (sndrcvinfo.sinfo_stream == GMT_STREAM) {
      printf("(GMT  ) %s\n", buffer);
    }
  }
  /* Close our socket and exit */
  close(connSock);
  return 0;
}

在客戶機中，我們首先創(chuàng)建了一個 SCTP 套接字，然后創(chuàng)建了一個 sockaddr 結構，其中包含了將要連接的端點。connect 函數(shù)然后建立一個到服務器的連接。要獲取消息的流編號，SCTP 需要啟用套接字選項 sctp_data_io_event。

通過啟用這個選項，我們就可以通過 sctp_recvmsg API 函數(shù)接收一條消息，我們還接收到一個包含流編號的 sctp_sndrcvinfo 結構。這個編號讓我們可以區(qū)分開流 0（本地時間）和流 1（GMT）的消息。

SCTP 的未來發(fā)展

SCTP 是一個相當新的協(xié)議，它在 2000 年 10 月份才成為一個 RFC 規(guī)范。從那以后，它開始進入所有的主流操作系統(tǒng)，包括 GNU/Linux、BSD 和 Solaris。在 Microsoft® Windows® 操作系統(tǒng)上也有第三方的商業(yè)包可以使用。

在獲得高可用性的同時，應用程序也已經(jīng)開始使用 SCTP 作為自己的主要傳輸機制。諸如 FTP 和 HTTP 之類的傳統(tǒng)應用程序已經(jīng)在 SCTP 的特性基礎上進行了構建。其他一些協(xié)議也正在開始使用 SCTP，例如會話初始化協(xié)議（Session Initiation Protocol，SIP）和通用通道信號系統(tǒng) 7（SS7）。在商業(yè)領域中，您可以在 Cisco 的 IOS 中找到 SCTP 的影子。

隨著 SCTP 被吸納到 2.6 版本的 Linux 內核中，現(xiàn)在我們可以構建并部署高可用性、高可靠性的網(wǎng)絡應用程序。作為一種基于 IP 的協(xié)議，SCTP 不但可以無縫地替換 TCP 和 UDP，而且擴展了很多新服務，例如多宿主、多流，并且對安全性也有了很大的提高。現(xiàn)在您已經(jīng)了解了 SCTP 的一些高級特性，并且探索了它的一些其他功能。Linux Kernel SCTP 項目（lksctp）提供了可以為您提供輔助的 API 擴展和文檔。

回頁首

下載

描述	名字	大小	下載方法
Multi-streaming demo source code	l-sctp-msdemo.zip	74KB	HTTP

關于下載方法的信息

參考資料

學習

您可以參閱本文在 developerWorks 全球站點上的英文原文。
RFC 3286 是 SCTP 協(xié)議的簡介。
請參閱 Stream Control Transmission Protocol (SCTP): A Reference Guide（Addison-Wesley，2002 年），本指南是由該協(xié)議的創(chuàng)建者 Randall Stewart 和 Qiaobing Xie 撰寫的。
University of Delaware 的研究者正在研究其他傳輸層協(xié)議，例如 SCTP。
RFC 2960 是 SCTP 的 Internet 標準。
文章 “內核比較: 2.6 內核中網(wǎng)絡的改進”（developerWorks，2004 年 3 月）介紹了很多網(wǎng)絡領域的改進，內容從隧道和更好地實現(xiàn)文件的安全性一直到加密和私密性保護。
教程 “Linux Socket 編程，第二部分 ”（developerWorks，2004 年 1 月）著重介紹了 UDP 的內容，并展示了如何使用 C 和 Python 來編寫 UDP 套接字應用程序（不過這些代碼也可以轉換成其他語言）。
在 developerWorks Linux 專區(qū) 中可以找到為 Linux 開發(fā)人員準備的更多資源。
跟蹤 developerWorks 技術事件和 Webcasts 的最新進展。

獲得產(chǎn)品和技術

從 SourceForge 上的 Linux Kernel SCTP Project 主頁中，可以獲得更多信息，還可以下載到最新版本的 SCTP。
在 The Linux Kernel Archives 上，可以找到最新的 Linux 內核。
訂購免費的 SEK for Linux，這有兩張 DVD，包括最新的 IBM for Linux 的試用軟件，包括 DB2®、Lotus®、Rational®、Tivoli® 和 WebSphere®。
在您的下一個開發(fā)項目中采用 IBM 試用軟件，這可以從 developerWorks 上直接下載。

討論

通過參與 developerWorks blogs 加入 developerWorks 社區(qū)。

關于作者

M. Tim Jones 是一名嵌入式軟件工程師，他是 GNU/Linux Application Programming、AI Application Programming和 BSD Sockets Programming from a Multilanguage Perspective 等書的作者。他的工程背景非常廣泛，從同步宇宙飛船的內核開發(fā)到嵌入式架構設計，再到網(wǎng)絡協(xié)議的開發(fā)。Tim 是 Emulex Corp. 的一名資深軟件工程師。

posted on 2013-09-02 05:06 楊粼波閱讀(1062) 評論(0) 編輯收藏引用

只有注冊用戶登錄后才能發(fā)表評論。
【推薦】100%開源！大型工業(yè)跨平臺軟件C++源碼提供，建模，組態(tài)！



網(wǎng)站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

牽著老婆滿街逛

導航

統(tǒng)計

公告

常用鏈接

留言簿(11)

隨筆分類(466)

隨筆檔案(1513)

文章分類(46)

文章檔案(45)

相冊

收藏夾(39)

工具官網(wǎng)

技術網(wǎng)站

開源網(wǎng)站

其他窩點

收藏網(wǎng)站

銀行官網(wǎng)

友情鏈接

資源共享

搜索

積分與排名

最新評論

閱讀排行榜

使用 SCTP 優(yōu)化網(wǎng)絡