• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-161  評(píng)論-223  文章-30  trackbacks-0
            引言
               在Unix的世界里,萬(wàn)物皆文件,通過(guò)虛擬文件系統(tǒng)VFS,程序可以用標(biāo)準(zhǔn)的Unix系統(tǒng)調(diào)用對(duì)不同的文件系統(tǒng),甚至不同介質(zhì)上的文件系統(tǒng)進(jìn)行讀寫操作。對(duì)于網(wǎng)絡(luò)套接字socket也是如此,除了專屬的Berkeley Sockets API,還支持一些標(biāo)準(zhǔn)的文件IO系統(tǒng)調(diào)用如read(v)、write(v)和close等。那么為什么socket也支持文件IO系統(tǒng)調(diào)用呢?在Linux上,這是通過(guò)套接口偽文件系統(tǒng)sockfs來(lái)實(shí)現(xiàn)的,因?yàn)閟ockfs實(shí)現(xiàn)了VFS中的4種主要對(duì)象:超級(jí)塊super block、索引節(jié)點(diǎn)inode、目錄項(xiàng)對(duì)象dentry和文件對(duì)象file,當(dāng)執(zhí)行文件IO系統(tǒng)調(diào)用時(shí),VFS就將請(qǐng)求轉(zhuǎn)發(fā)給sockfs,而sockfs就調(diào)用特定的協(xié)議實(shí)現(xiàn),層次結(jié)構(gòu)如下圖:
               本文以linux 2.6.34實(shí)現(xiàn)為基礎(chǔ),本篇闡述初始化和Socket創(chuàng)建兩部分的實(shí)現(xiàn),下篇闡述Socket操作和銷毀兩部分的實(shí)現(xiàn)。

            初始化
               在內(nèi)核引導(dǎo)時(shí)初始化網(wǎng)絡(luò)子系統(tǒng),進(jìn)而調(diào)用sock_init,該函數(shù)主要步驟如下:創(chuàng)建inode緩存,注冊(cè)和裝載sockfs,定義在net/socket.c中。
            1static int __init sock_init(void)
            2{
            3    
            4    init_inodecache();
            5    register_filesystem(&sock_fs_type);
            6    sock_mnt = kern_mount(&sock_fs_type);
            7    
            8}
               
               創(chuàng)建inode緩存
               init_inodecache為socket_alloc對(duì)象創(chuàng)建SLAB緩存,名稱為sock_inode_cachep,socket_alloc定義在include/net/sock.h中。
            1struct socket_alloc {
            2    struct socket socket;
            3    struct inode vfs_inode;
            4}
            ;
               socket_alloc由socket和inode結(jié)構(gòu)2部分組成,這樣就方便了在套接字與inode對(duì)象間雙向定位。

               注冊(cè)sockfs
               調(diào)用VFS的函數(shù)register_filesystem實(shí)現(xiàn)注冊(cè),sock_fs_type定義在net/socket.c中。
            1static struct file_system_type sock_fs_type = {
            2    .name =        "sockfs",
            3    .get_sb =    sockfs_get_sb,
            4    .kill_sb =    kill_anon_super,
            5}
            ;
               sock_fs_type包含了文件系統(tǒng)sockfs的名稱、創(chuàng)建和銷毀super block的函數(shù),其中sockfs_get_sb實(shí)現(xiàn)在net/socket.c中。
            1static int sockfs_get_sb(struct file_system_type *fs_type,int flags, const char *dev_name, void *data,struct vfsmount *mnt)
            2{
            3    return get_sb_pseudo(fs_type, "socket:"&sockfs_ops, SOCKFS_MAGIC, mnt);
            4}
               它在kern_mount內(nèi)被執(zhí)行,通過(guò)調(diào)用get_sb_pseudo創(chuàng)建了一個(gè)super block(包含一個(gè)對(duì)應(yīng)dentry及一個(gè)關(guān)聯(lián)inode):操作對(duì)象為sockfs_ops,根目錄名稱為socket:,對(duì)應(yīng)的根索引節(jié)點(diǎn)編號(hào)為1。
               sockfs_ops定義在net/socket.c中。
            1static const struct super_operations sockfs_ops = {
            2    .alloc_inode =    sock_alloc_inode,
            3    .destroy_inode = sock_destroy_inode,
            4    .statfs =    simple_statfs,
            5}
            ;
               sock_alloc_inode用于分配inode對(duì)象,將在socket創(chuàng)建過(guò)程中被調(diào)用;sock_destroy_inode用于釋放inode對(duì)象,將在socket銷毀過(guò)程中被調(diào)用;simple_statfs用于獲取sockfs文件系統(tǒng)的狀態(tài)信息。
               
               裝載sockfs
               由kern_mount函數(shù)實(shí)現(xiàn)裝載一個(gè)偽文件系統(tǒng)(當(dāng)然,它沒(méi)有裝載點(diǎn)),返回一個(gè)static vfsmount對(duì)象sock_mnt。

               經(jīng)過(guò)以上步驟后,所創(chuàng)建的VFS對(duì)象關(guān)系如下圖:
                對(duì)于根目錄項(xiàng),不用進(jìn)行路徑轉(zhuǎn)換,因此dentry的d_op為空(未畫出);對(duì)于偽文件系統(tǒng),操作索引對(duì)象沒(méi)有意義,所以inode的i_op為空(未畫出)。

            Socket創(chuàng)建


               系統(tǒng)調(diào)用socket、accept和socketpair是用戶空間創(chuàng)建socket的幾種方法,其核心調(diào)用鏈如下圖:
               從上圖可知共同的核心就3個(gè)過(guò)程:先構(gòu)造inode,再構(gòu)造對(duì)應(yīng)的file,最后安裝file到當(dāng)前進(jìn)程中(即關(guān)聯(lián)映射到一個(gè)未用的文件描述符),下面就這3個(gè)過(guò)程進(jìn)行詳細(xì)說(shuō)明。

               構(gòu)造inode
               由sock_alloc函數(shù)實(shí)現(xiàn),定義在net/socket.c中。
             1static struct socket *sock_alloc(void)
             2{
             3    struct inode *inode;
             4    struct socket *sock;
             5
             6    inode = new_inode(sock_mnt->mnt_sb);
             7        
             8    sock = SOCKET_I(inode);
             9            
            10    inode->i_mode = S_IFSOCK | S_IRWXUGO;
            11    inode->i_uid = current_fsuid();
            12    inode->i_gid = current_fsgid();
            13        
            14    return sock;
            15}
               先調(diào)用new_inode創(chuàng)建inode對(duì)象,再設(shè)置它的類型為S_IFSOCK,由此可知inode對(duì)應(yīng)的文件類型為套接字。new_inode是文件系統(tǒng)的一個(gè)接口函數(shù),用于創(chuàng)建一個(gè)inode對(duì)象,定義在fs/inode.c中,它調(diào)用了sockfs超級(jí)塊的操作對(duì)象即sockfs_ops的sock_alloc_inode方法,由于sock_alloc_inode實(shí)際創(chuàng)建的是socket_alloc復(fù)合對(duì)象,因此要使用SOCKET_I宏從inode中取出關(guān)聯(lián)的socket對(duì)象用于返回。

               構(gòu)造file
               有了inode對(duì)象后,接下來(lái)就要構(gòu)造對(duì)應(yīng)的file對(duì)象了,由sock_alloc_file實(shí)現(xiàn),定義在net/socket.c中。
             1static int sock_alloc_file(struct socket *sock, struct file **f, int flags)
             2{
             3    struct qstr name = { .name = "" };
             4    struct path path;
             5    struct file *file;
             6    int fd;
             7
             8    fd = get_unused_fd_flags(flags);
             9        
            10    path.dentry = d_alloc(sock_mnt->mnt_sb->s_root, &name);
            11        
            12    path.mnt = mntget(sock_mnt);
            13
            14    path.dentry->d_op = &sockfs_dentry_operations;
            15    d_instantiate(path.dentry, SOCK_INODE(sock));
            16    SOCK_INODE(sock)->i_fop = &socket_file_ops;
            17
            18    file = alloc_file(&path, FMODE_READ | FMODE_WRITE, &socket_file_ops);
            19    
            20    sock->file = file;
            21    file->f_flags = O_RDWR | (flags & O_NONBLOCK);
            22    file->f_pos = 0;
            23    file->private_data = sock;
            24
            25    *= file;
            26    return fd;
            27}
               sock為上一過(guò)程返回的套接字對(duì)象,該函數(shù)主要做了以下幾件事:
               1)得到空閑的文件描述符fd,實(shí)際上就是fd數(shù)組的索引,準(zhǔn)備作為返回值。
               2)先初始化路徑path:其目錄項(xiàng)的父目錄項(xiàng)為超級(jí)塊對(duì)應(yīng)的根目錄,名稱為空,操作對(duì)象為sockfs_dentry_operations,對(duì)應(yīng)的索引節(jié)點(diǎn)對(duì)象為sock套接字關(guān)聯(lián)的索引節(jié)點(diǎn)對(duì)象,即SOCK_INODE(sock);裝載點(diǎn)為sock_mnt。  
               sockfs_dentry_operations定義在net/socket.c中。
            1static const struct dentry_operations sockfs_dentry_operations = {
            2    .d_dname  = sockfs_dname,
            3}
            ;
               sockfs_dname會(huì)被d_path調(diào)用,用于計(jì)算socket對(duì)象的目錄項(xiàng)名稱。
               3)設(shè)置索引節(jié)點(diǎn)的文件操作對(duì)象為socket_file_ops,定義在net/socket.c中。
            1static const struct file_operations socket_file_ops = {
            2    
            3    .aio_read =    sock_aio_read,
            4    .aio_write =    sock_aio_write,
            5    
            6    .open =        sock_no_open,    /* special open code to disallow open via /proc */
            7    .release =    sock_close,
            8    
            9}
            ;
               4)調(diào)用alloc_file,以path和socket_file_ops為輸入?yún)?shù),這樣返回得到的file便與sock的inode關(guān)聯(lián)上了,并且操作對(duì)象為socket_file_ops,最后設(shè)置到輸出參數(shù)f中。
               5)建立file與socket的一一映射關(guān)系。
               
               安裝file
               由fd_install實(shí)現(xiàn),定義在fs/open.c中。
             1void fd_install(unsigned int fd, struct file *file)
             2{
             3    struct files_struct *files = current->files;
             4    struct fdtable *fdt;
             5    spin_lock(&files->file_lock);
             6    fdt = files_fdtable(files);
             7    BUG_ON(fdt->fd[fd] != NULL);
             8    rcu_assign_pointer(fdt->fd[fd], file);
             9    spin_unlock(&files->file_lock);
            10}
               fd和file分別為上一過(guò)程返回的空閑文件描述符和文件對(duì)象,使RCU技術(shù)來(lái)設(shè)置file到當(dāng)前進(jìn)程的fd數(shù)組中。
             
               經(jīng)過(guò)以上過(guò)程后,所創(chuàng)建的VFS對(duì)象關(guān)系圖如下
               fd為file*數(shù)組的索引而不是成員字段;vfsmount與初始化之VFS對(duì)象關(guān)系圖中的vfsmount是同一個(gè)對(duì)象,即sock_mnt;對(duì)于偽文件系統(tǒng),操作索引對(duì)象沒(méi)有意義,所以inode的i_op為空(未畫出)。
            posted on 2015-05-03 16:31 春秋十二月 閱讀(8667) 評(píng)論(0)  編輯 收藏 引用 所屬分類: Network
            久久久亚洲欧洲日产国码aⅴ| 久久人人爽人人人人片av| 国产精品9999久久久久| 中文国产成人精品久久不卡| 日韩精品久久久久久久电影蜜臀| 国产成人久久激情91| 亚洲午夜无码AV毛片久久| 97久久婷婷五月综合色d啪蜜芽| 久久综合狠狠综合久久综合88| 青青青国产精品国产精品久久久久 | 久久精品国产只有精品2020| 久久久无码精品亚洲日韩软件| 亚洲色欲久久久综合网 | 性做久久久久久久久久久| 久久综合狠狠综合久久| 手机看片久久高清国产日韩| 美女写真久久影院| 亚洲国产精品一区二区久久hs| 久久精品国产精品亚洲人人| 丰满少妇高潮惨叫久久久| 九九精品久久久久久噜噜| 情人伊人久久综合亚洲| 精品久久久久香蕉网| 中文字幕日本人妻久久久免费| 久久青青国产| 国产精品热久久毛片| 日本福利片国产午夜久久| 国产成年无码久久久久毛片| 久久WWW免费人成一看片| 亚洲国产成人精品女人久久久 | 久久www免费人成看国产片| 狠狠色噜噜狠狠狠狠狠色综合久久| A级毛片无码久久精品免费| 99久久综合国产精品免费| 欧美久久一级内射wwwwww.| 久久综合久久鬼色| 亚洲国产精品嫩草影院久久| 久久人搡人人玩人妻精品首页| 久久精品国产亚洲5555| 欧美色综合久久久久久| 亚洲日本久久久午夜精品|