• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            我要啦免费统计
            filecache  32m
            內存映射文件 處理md5,io cpu都降下來了
            254file 6.54g
            多線程
            線程數 cpu_count()
            cpu變為38%  io減為 讀取16,348 寫入 2,000
            [2013-04-19 12:09:02] check is ok!
            [2013-04-19 12:10:06] check is ok!
            64s
            單線程
            [2013-04-19 11:57:00] is ok
            [2013-04-19 11:57:41] is ok
            41s
            -----------------------------------------------------------------------------------
            多線程 增加運行線程數
            cpu_count()*2;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:23:49] check is ok!
            [2013-04-19 13:24:14] check is ok!
            25s
            cpu 占用53%最多峰值
            cpu_count()*4;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:27:57] check is ok!
            [2013-04-19 13:28:19] check is ok!
            22s
            cpu90%峰值
            cpu_count()*8;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:30:44] check is ok!
            [2013-04-19 13:30:51] check is ok!
            7s
            cpu100%峰值
            cpu_count()*16
            [2013-04-19 13:33:23] check is ok!
            [2013-04-19 13:33:31] check is ok!
            8s
            cpu100%峰值


            單線程:

            2081 FILE
            11.9G
            [2013-04-24 15:32:28] is ok
            [2013-04-24 15:41:31] is ok
            9分鐘
            磁盤到了讀取的極限 20-30m/s
            cpu 未充滿 20%左右
            io為瓶頸


            總結:采用內存映射文件,一次性加載文件到內存塊計算md5 降io和io cpu損耗
            采用線程和cpu親緣性,充分利用釋放出來的cpu計算能力。
            實驗記過254哥文件6.5g  4核機器 開啟32哥線程分布到各個cpu 可以得到7秒的計算結果,比上面單線程未優化提升6倍速度,比上面多線程未優化提升9倍

            一個解決方案:
            一個文件: 分段md5,    特征為 md51|md52|md53……
            一個連續讀取文件的線程,
            每個md5作為一個任務計算。
            讀取持續性讀取,到一個連續性內存,分段任務給線程池分段計算,算完全體統計一下,
            如果過程中出現里面局部有一個是失敗的,那么整個數據都不用驗證了,其他任務也不用繼續了,直接認為失敗,這個概率很高。減少計算一大堆,切分粒度中一點別切太多片。每個任務結束的時候都釋放內存回收使用。
            io在獨立線程, 計算md5在線程池,這樣徹底分離,重復內存持續復用。

            posted on 2013-04-19 13:44 閱讀(2596) 評論(5)  編輯 收藏 引用 所屬分類: life

            評論:
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-04-19 17:17 | YzL
            這個跟MD5有啥關系??我還以為是單文件能多線程計算,這才跟MD5有點意義  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-04-19 17:32 | 蔡東赟
            @YzL
            我這里有上w個文件,解決當前問題為主要要務。

            單文件多線程md5 沒有那個功力啊。  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-03 12:08 | x x
            磁盤的讀取極限絕對不止20M-30M.  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-05 21:42 | 蔡東赟
            @x x

            system占用 40m/s了
            我程序也三四十m了。


              回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-05 21:43 | 蔡東赟
            @x x

            還有方案不?

            上面是虛擬內存用完了,卡在虛擬內存了。
            難道直接用系統的物理內存
              回復  更多評論
              
            伊人色综合久久天天| 精品国产日韩久久亚洲| 国产精品久久久久国产A级| 亚洲伊人久久大香线蕉综合图片| 亚洲国产精品无码成人片久久| 亚洲国产精品18久久久久久| 狠狠色丁香婷婷久久综合不卡 | 久久久久亚洲av成人无码电影| 亚洲精品视频久久久| …久久精品99久久香蕉国产| 国产女人aaa级久久久级| 精品国产乱码久久久久久人妻| 潮喷大喷水系列无码久久精品| 精品国产热久久久福利| 伊人久久综合精品无码AV专区| 婷婷综合久久狠狠色99h| 久久天天躁狠狠躁夜夜躁2014| 久久免费精品视频| 久久综合精品国产二区无码| 91精品国产综合久久四虎久久无码一级| 久久久这里有精品中文字幕| 97久久超碰国产精品2021| 狠狠色丁香久久婷婷综合蜜芽五月| 污污内射久久一区二区欧美日韩| 久久天天婷婷五月俺也去| 久久精品国产免费| 97久久精品无码一区二区天美| 伊人色综合九久久天天蜜桃| 爱做久久久久久| 国产精品久久久久AV福利动漫| 国产精品久久新婚兰兰| 国产免费久久久久久无码| 精品久久香蕉国产线看观看亚洲| 久久亚洲精品人成综合网| 精品国产99久久久久久麻豆| 无码任你躁久久久久久| 久久天天躁狠狠躁夜夜av浪潮 | 久久精品国产一区二区三区日韩| 久久综合香蕉国产蜜臀AV| 久久久久亚洲av无码专区导航| 久久人人爽人人爽人人爽|