• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-159  評(píng)論-223  文章-30  trackbacks-0
            引言
               在Unix的世界里,萬物皆文件,通過虛擬文件系統(tǒng)VFS,程序可以用標(biāo)準(zhǔn)的Unix系統(tǒng)調(diào)用對(duì)不同的文件系統(tǒng),甚至不同介質(zhì)上的文件系統(tǒng)進(jìn)行讀寫操作。對(duì)于網(wǎng)絡(luò)套接字socket也是如此,除了專屬的Berkeley Sockets API,還支持一些標(biāo)準(zhǔn)的文件IO系統(tǒng)調(diào)用如read(v)、write(v)和close等。那么為什么socket也支持文件IO系統(tǒng)調(diào)用呢?在Linux上,這是通過套接口偽文件系統(tǒng)sockfs來實(shí)現(xiàn)的,因?yàn)閟ockfs實(shí)現(xiàn)了VFS中的4種主要對(duì)象:超級(jí)塊super block、索引節(jié)點(diǎn)inode、目錄項(xiàng)對(duì)象dentry和文件對(duì)象file,當(dāng)執(zhí)行文件IO系統(tǒng)調(diào)用時(shí),VFS就將請(qǐng)求轉(zhuǎn)發(fā)給sockfs,而sockfs就調(diào)用特定的協(xié)議實(shí)現(xiàn),層次結(jié)構(gòu)如下圖:
               本文以linux 2.6.34實(shí)現(xiàn)為基礎(chǔ),本篇闡述初始化和Socket創(chuàng)建兩部分的實(shí)現(xiàn),下篇闡述Socket操作和銷毀兩部分的實(shí)現(xiàn)。

            初始化
               在內(nèi)核引導(dǎo)時(shí)初始化網(wǎng)絡(luò)子系統(tǒng),進(jìn)而調(diào)用sock_init,該函數(shù)主要步驟如下:創(chuàng)建inode緩存,注冊(cè)和裝載sockfs,定義在net/socket.c中。
            1static int __init sock_init(void)
            2{
            3    
            4    init_inodecache();
            5    register_filesystem(&sock_fs_type);
            6    sock_mnt = kern_mount(&sock_fs_type);
            7    
            8}
               
               創(chuàng)建inode緩存
               init_inodecache為socket_alloc對(duì)象創(chuàng)建SLAB緩存,名稱為sock_inode_cachep,socket_alloc定義在include/net/sock.h中。
            1struct socket_alloc {
            2    struct socket socket;
            3    struct inode vfs_inode;
            4}
            ;
               socket_alloc由socket和inode結(jié)構(gòu)2部分組成,這樣就方便了在套接字與inode對(duì)象間雙向定位。

               注冊(cè)sockfs
               調(diào)用VFS的函數(shù)register_filesystem實(shí)現(xiàn)注冊(cè),sock_fs_type定義在net/socket.c中。
            1static struct file_system_type sock_fs_type = {
            2    .name =        "sockfs",
            3    .get_sb =    sockfs_get_sb,
            4    .kill_sb =    kill_anon_super,
            5}
            ;
               sock_fs_type包含了文件系統(tǒng)sockfs的名稱、創(chuàng)建和銷毀super block的函數(shù),其中sockfs_get_sb實(shí)現(xiàn)在net/socket.c中。
            1static int sockfs_get_sb(struct file_system_type *fs_type,int flags, const char *dev_name, void *data,struct vfsmount *mnt)
            2{
            3    return get_sb_pseudo(fs_type, "socket:"&sockfs_ops, SOCKFS_MAGIC, mnt);
            4}
               它在kern_mount內(nèi)被執(zhí)行,通過調(diào)用get_sb_pseudo創(chuàng)建了一個(gè)super block(包含一個(gè)對(duì)應(yīng)dentry及一個(gè)關(guān)聯(lián)inode):操作對(duì)象為sockfs_ops,根目錄名稱為socket:,對(duì)應(yīng)的根索引節(jié)點(diǎn)編號(hào)為1。
               sockfs_ops定義在net/socket.c中。
            1static const struct super_operations sockfs_ops = {
            2    .alloc_inode =    sock_alloc_inode,
            3    .destroy_inode = sock_destroy_inode,
            4    .statfs =    simple_statfs,
            5}
            ;
               sock_alloc_inode用于分配inode對(duì)象,將在socket創(chuàng)建過程中被調(diào)用;sock_destroy_inode用于釋放inode對(duì)象,將在socket銷毀過程中被調(diào)用;simple_statfs用于獲取sockfs文件系統(tǒng)的狀態(tài)信息。
               
               裝載sockfs
               由kern_mount函數(shù)實(shí)現(xiàn)裝載一個(gè)偽文件系統(tǒng)(當(dāng)然,它沒有裝載點(diǎn)),返回一個(gè)static vfsmount對(duì)象sock_mnt。

               經(jīng)過以上步驟后,所創(chuàng)建的VFS對(duì)象關(guān)系如下圖:
                對(duì)于根目錄項(xiàng),不用進(jìn)行路徑轉(zhuǎn)換,因此dentry的d_op為空(未畫出);對(duì)于偽文件系統(tǒng),操作索引對(duì)象沒有意義,所以inode的i_op為空(未畫出)。

            Socket創(chuàng)建


               系統(tǒng)調(diào)用socket、accept和socketpair是用戶空間創(chuàng)建socket的幾種方法,其核心調(diào)用鏈如下圖:
               從上圖可知共同的核心就3個(gè)過程:先構(gòu)造inode,再構(gòu)造對(duì)應(yīng)的file,最后安裝file到當(dāng)前進(jìn)程中(即關(guān)聯(lián)映射到一個(gè)未用的文件描述符),下面就這3個(gè)過程進(jìn)行詳細(xì)說明。

               構(gòu)造inode
               由sock_alloc函數(shù)實(shí)現(xiàn),定義在net/socket.c中。
             1static struct socket *sock_alloc(void)
             2{
             3    struct inode *inode;
             4    struct socket *sock;
             5
             6    inode = new_inode(sock_mnt->mnt_sb);
             7        
             8    sock = SOCKET_I(inode);
             9            
            10    inode->i_mode = S_IFSOCK | S_IRWXUGO;
            11    inode->i_uid = current_fsuid();
            12    inode->i_gid = current_fsgid();
            13        
            14    return sock;
            15}
               先調(diào)用new_inode創(chuàng)建inode對(duì)象,再設(shè)置它的類型為S_IFSOCK,由此可知inode對(duì)應(yīng)的文件類型為套接字。new_inode是文件系統(tǒng)的一個(gè)接口函數(shù),用于創(chuàng)建一個(gè)inode對(duì)象,定義在fs/inode.c中,它調(diào)用了sockfs超級(jí)塊的操作對(duì)象即sockfs_ops的sock_alloc_inode方法,由于sock_alloc_inode實(shí)際創(chuàng)建的是socket_alloc復(fù)合對(duì)象,因此要使用SOCKET_I宏從inode中取出關(guān)聯(lián)的socket對(duì)象用于返回。

               構(gòu)造file
               有了inode對(duì)象后,接下來就要構(gòu)造對(duì)應(yīng)的file對(duì)象了,由sock_alloc_file實(shí)現(xiàn),定義在net/socket.c中。
             1static int sock_alloc_file(struct socket *sock, struct file **f, int flags)
             2{
             3    struct qstr name = { .name = "" };
             4    struct path path;
             5    struct file *file;
             6    int fd;
             7
             8    fd = get_unused_fd_flags(flags);
             9        
            10    path.dentry = d_alloc(sock_mnt->mnt_sb->s_root, &name);
            11        
            12    path.mnt = mntget(sock_mnt);
            13
            14    path.dentry->d_op = &sockfs_dentry_operations;
            15    d_instantiate(path.dentry, SOCK_INODE(sock));
            16    SOCK_INODE(sock)->i_fop = &socket_file_ops;
            17
            18    file = alloc_file(&path, FMODE_READ | FMODE_WRITE, &socket_file_ops);
            19    
            20    sock->file = file;
            21    file->f_flags = O_RDWR | (flags & O_NONBLOCK);
            22    file->f_pos = 0;
            23    file->private_data = sock;
            24
            25    *= file;
            26    return fd;
            27}
               sock為上一過程返回的套接字對(duì)象,該函數(shù)主要做了以下幾件事:
               1)得到空閑的文件描述符fd,實(shí)際上就是fd數(shù)組的索引,準(zhǔn)備作為返回值。
               2)先初始化路徑path:其目錄項(xiàng)的父目錄項(xiàng)為超級(jí)塊對(duì)應(yīng)的根目錄,名稱為空,操作對(duì)象為sockfs_dentry_operations,對(duì)應(yīng)的索引節(jié)點(diǎn)對(duì)象為sock套接字關(guān)聯(lián)的索引節(jié)點(diǎn)對(duì)象,即SOCK_INODE(sock);裝載點(diǎn)為sock_mnt。  
               sockfs_dentry_operations定義在net/socket.c中。
            1static const struct dentry_operations sockfs_dentry_operations = {
            2    .d_dname  = sockfs_dname,
            3}
            ;
               sockfs_dname會(huì)被d_path調(diào)用,用于計(jì)算socket對(duì)象的目錄項(xiàng)名稱。
               3)設(shè)置索引節(jié)點(diǎn)的文件操作對(duì)象為socket_file_ops,定義在net/socket.c中。
            1static const struct file_operations socket_file_ops = {
            2    
            3    .aio_read =    sock_aio_read,
            4    .aio_write =    sock_aio_write,
            5    
            6    .open =        sock_no_open,    /* special open code to disallow open via /proc */
            7    .release =    sock_close,
            8    
            9}
            ;
               4)調(diào)用alloc_file,以path和socket_file_ops為輸入?yún)?shù),這樣返回得到的file便與sock的inode關(guān)聯(lián)上了,并且操作對(duì)象為socket_file_ops,最后設(shè)置到輸出參數(shù)f中。
               5)建立file與socket的一一映射關(guān)系。
               
               安裝file
               由fd_install實(shí)現(xiàn),定義在fs/open.c中。
             1void fd_install(unsigned int fd, struct file *file)
             2{
             3    struct files_struct *files = current->files;
             4    struct fdtable *fdt;
             5    spin_lock(&files->file_lock);
             6    fdt = files_fdtable(files);
             7    BUG_ON(fdt->fd[fd] != NULL);
             8    rcu_assign_pointer(fdt->fd[fd], file);
             9    spin_unlock(&files->file_lock);
            10}
               fd和file分別為上一過程返回的空閑文件描述符和文件對(duì)象,使RCU技術(shù)來設(shè)置file到當(dāng)前進(jìn)程的fd數(shù)組中。
             
               經(jīng)過以上過程后,所創(chuàng)建的VFS對(duì)象關(guān)系圖如下
               fd為file*數(shù)組的索引而不是成員字段;vfsmount與初始化之VFS對(duì)象關(guān)系圖中的vfsmount是同一個(gè)對(duì)象,即sock_mnt;對(duì)于偽文件系統(tǒng),操作索引對(duì)象沒有意義,所以inode的i_op為空(未畫出)。
            posted on 2015-05-03 16:31 春秋十二月 閱讀(8635) 評(píng)論(0)  編輯 收藏 引用 所屬分類: Network
            久久精品国产99久久久| 综合人妻久久一区二区精品| 久久久久亚洲AV无码观看| 久久亚洲国产精品一区二区| www性久久久com| 香蕉久久夜色精品升级完成| 精品综合久久久久久98| 热99RE久久精品这里都是精品免费 | 久久精品桃花综合| 久久国产香蕉一区精品| 国产精品综合久久第一页| 99热都是精品久久久久久| 日本久久久精品中文字幕| 日本三级久久网| 国产精品美女久久久免费| 91精品国产91久久| 亚洲精品高清久久| 久久99久久无码毛片一区二区| 国产精品无码久久久久| 久久久久婷婷| 日韩人妻无码一区二区三区久久99| 亚洲午夜久久久久久久久电影网| 亚洲国产精品无码久久98| 久久香综合精品久久伊人| 久久精品国产亚洲av水果派 | 久久无码一区二区三区少妇| 久久精品国产99国产电影网| 国产成人久久精品麻豆一区| 久久久久九九精品影院| 久久人人爽人人爽人人片AV不| 久久人人妻人人爽人人爽| 久久精品视频网| 亚洲精品tv久久久久| 久久久无码精品亚洲日韩按摩 | 亚洲AV无码久久精品蜜桃| 精品久久久久久无码专区不卡| 久久精品一区二区国产| 亚洲国产成人久久精品99| 欧美va久久久噜噜噜久久| 国产精品亚洲综合专区片高清久久久| 亚洲午夜无码久久久久小说|