• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            我要啦免费统计
            filecache  32m
            內存映射文件 處理md5,io cpu都降下來了
            254file 6.54g
            多線程
            線程數 cpu_count()
            cpu變為38%  io減為 讀取16,348 寫入 2,000
            [2013-04-19 12:09:02] check is ok!
            [2013-04-19 12:10:06] check is ok!
            64s
            單線程
            [2013-04-19 11:57:00] is ok
            [2013-04-19 11:57:41] is ok
            41s
            -----------------------------------------------------------------------------------
            多線程 增加運行線程數
            cpu_count()*2;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:23:49] check is ok!
            [2013-04-19 13:24:14] check is ok!
            25s
            cpu 占用53%最多峰值
            cpu_count()*4;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:27:57] check is ok!
            [2013-04-19 13:28:19] check is ok!
            22s
            cpu90%峰值
            cpu_count()*8;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:30:44] check is ok!
            [2013-04-19 13:30:51] check is ok!
            7s
            cpu100%峰值
            cpu_count()*16
            [2013-04-19 13:33:23] check is ok!
            [2013-04-19 13:33:31] check is ok!
            8s
            cpu100%峰值


            單線程:

            2081 FILE
            11.9G
            [2013-04-24 15:32:28] is ok
            [2013-04-24 15:41:31] is ok
            9分鐘
            磁盤到了讀取的極限 20-30m/s
            cpu 未充滿 20%左右
            io為瓶頸


            總結:采用內存映射文件,一次性加載文件到內存塊計算md5 降io和io cpu損耗
            采用線程和cpu親緣性,充分利用釋放出來的cpu計算能力。
            實驗記過254哥文件6.5g  4核機器 開啟32哥線程分布到各個cpu 可以得到7秒的計算結果,比上面單線程未優化提升6倍速度,比上面多線程未優化提升9倍

            一個解決方案:
            一個文件: 分段md5,    特征為 md51|md52|md53……
            一個連續讀取文件的線程,
            每個md5作為一個任務計算。
            讀取持續性讀取,到一個連續性內存,分段任務給線程池分段計算,算完全體統計一下,
            如果過程中出現里面局部有一個是失敗的,那么整個數據都不用驗證了,其他任務也不用繼續了,直接認為失敗,這個概率很高。減少計算一大堆,切分粒度中一點別切太多片。每個任務結束的時候都釋放內存回收使用。
            io在獨立線程, 計算md5在線程池,這樣徹底分離,重復內存持續復用。

            posted on 2013-04-19 13:44 閱讀(2616) 評論(5)  編輯 收藏 引用 所屬分類: life

            評論:
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-04-19 17:17 | YzL
            這個跟MD5有啥關系??我還以為是單文件能多線程計算,這才跟MD5有點意義  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-04-19 17:32 | 蔡東赟
            @YzL
            我這里有上w個文件,解決當前問題為主要要務。

            單文件多線程md5 沒有那個功力啊。  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-03 12:08 | x x
            磁盤的讀取極限絕對不止20M-30M.  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-05 21:42 | 蔡東赟
            @x x

            system占用 40m/s了
            我程序也三四十m了。


              回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-05 21:43 | 蔡東赟
            @x x

            還有方案不?

            上面是虛擬內存用完了,卡在虛擬內存了。
            難道直接用系統的物理內存
              回復  更多評論
              
            久久精品国产亚洲一区二区| 欧美色综合久久久久久| 久久综合给久久狠狠97色| AV无码久久久久不卡网站下载| 久久精品国产亚洲沈樵| 青青草原综合久久大伊人导航| 中文无码久久精品| 99久久99久久精品国产片| 香蕉aa三级久久毛片| 久久精品国产一区二区三区日韩| 久久久久国色AV免费观看| 丰满少妇高潮惨叫久久久| 亚洲国产成人久久一区久久 | 亚洲精品无码久久久久去q | 久久嫩草影院免费看夜色| 久久午夜伦鲁片免费无码| 久久久久国产成人精品亚洲午夜| 亚洲精品无码久久久影院相关影片| 久久国产午夜精品一区二区三区| 久久午夜伦鲁片免费无码| 中文字幕无码精品亚洲资源网久久| 国产叼嘿久久精品久久| 久久这里只有精品18| 久久精品人妻中文系列| 久久99久久成人免费播放| 久久久九九有精品国产| 久久久久久夜精品精品免费啦| 久久只有这精品99| 久久青青草视频| 香港aa三级久久三级老师2021国产三级精品三级在 | 亚洲性久久久影院| 久久九九免费高清视频| 久久精品这里热有精品| 2021少妇久久久久久久久久| 亚洲精品乱码久久久久久久久久久久 | 精品国产青草久久久久福利| 一本久久a久久精品综合夜夜| 久久综合国产乱子伦精品免费| 亚洲国产精品成人久久| 欧洲成人午夜精品无码区久久| 亚洲AV无码1区2区久久|