• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            大龍的博客

            常用鏈接

            統(tǒng)計(jì)

            最新評(píng)論

            使用CPU時(shí)間戳進(jìn)行高精度計(jì)時(shí)---------------------轉(zhuǎn)


            #include? <mmsystem.h>

            #pragma comment(lib,"winmm.lib")

            timegettime的標(biāo)稱是毫秒級(jí)別
            但是實(shí)際上只能精確到50毫秒

            使用CPU時(shí)間戳進(jìn)行高精度計(jì)時(shí)

            2003-3-27 13:14:11?? GAMERES?? zhangyan_qd?? 閱讀次數(shù):?6609
              對(duì)關(guān)注性能的程序開發(fā)人員而言,一個(gè)好的計(jì)時(shí)部件既是益友,也是良師。計(jì)時(shí)器既可以作為程序組件幫助程序員精確的控制程序進(jìn)程,又是一件有力的調(diào)試武器,在有經(jīng)驗(yàn)的程序員手里可以盡快的確定程序的性能瓶頸,或者對(duì)不同的算法作出有說(shuō)服力的性能比較。

              在Windows平臺(tái)下,常用的計(jì)時(shí)器有兩種,一種是timeGetTime多媒體計(jì)時(shí)器,它可以提供毫秒級(jí)的計(jì)時(shí)。但這個(gè)精度對(duì)很多應(yīng)用場(chǎng)合而言還是太粗糙了。另一種是QueryPerformanceCount計(jì)數(shù)器,隨系統(tǒng)的不同可以提供微秒級(jí)的計(jì)數(shù)。對(duì)于實(shí)時(shí)圖形處理、多媒體數(shù)據(jù)流處理、或者實(shí)時(shí)系統(tǒng)構(gòu)造的程序員,善用QueryPerformanceCount/QueryPerformanceFrequency是一項(xiàng)基本功。

              本文要介紹的,是另一種直接利用Pentium?CPU內(nèi)部時(shí)間戳進(jìn)行計(jì)時(shí)的高精度計(jì)時(shí)手段。以下討論主要得益于《Windows圖形編程》一書,第 15頁(yè)-17頁(yè),有興趣的讀者可以直接參考該書。關(guān)于RDTSC指令的詳細(xì)討論,可以參考Intel產(chǎn)品手冊(cè)。本文僅僅作拋磚之用。
              在 Intel?Pentium以上級(jí)別的CPU中,有一個(gè)稱為“時(shí)間戳(Time?Stamp)”的部件,它以64位無(wú)符號(hào)整型數(shù)的格式,記錄了自CPU上電以來(lái)所經(jīng)過(guò)的時(shí)鐘周期數(shù)。由于目前的CPU主頻都非常高,因此這個(gè)部件可以達(dá)到納秒級(jí)的計(jì)時(shí)精度。這個(gè)精確性是上述兩種方法所無(wú)法比擬的。

              在Pentium以上的CPU中,提供了一條機(jī)器指令RDTSC(Read?Time?Stamp?Counter)來(lái)讀取這個(gè)時(shí)間戳的數(shù)字,并將其保存在EDX:EAX寄存器對(duì)中。由于EDX:EAX寄存器對(duì)恰好是Win32平臺(tái)下C++語(yǔ)言保存函數(shù)返回值的寄存器,所以我們可以把這條指令看成是一個(gè)普通的函數(shù)調(diào)用。像這樣:

            inline?unsigned?__int64?GetCycleCount()
            {
            ?__asm?RDTSC
            }

            但是不行,因?yàn)镽DTSC不被C++的內(nèi)嵌匯編器直接支持,所以我們要用_emit偽指令直接嵌入該指令的機(jī)器碼形式0X0F、0X31,如下:

            inline?unsigned?__int64?GetCycleCount()
            {
            ?__asm?_emit?0x0F
            ?__asm?_emit?0x31
            }

            以后在需要計(jì)數(shù)器的場(chǎng)合,可以像使用普通的Win32?API一樣,調(diào)用兩次GetCycleCount函數(shù),比較兩個(gè)返回值的差,像這樣:

            unsigned?long?t;
            t?=?(unsigned?long)GetCycleCount();
            //Do?Something?time-intensive?...
            t?-=?(unsigned?long)GetCycleCount();

              《Windows圖形編程》第15頁(yè)編寫了一個(gè)類,把這個(gè)計(jì)數(shù)器封裝起來(lái)。有興趣的讀者可以去參考那個(gè)類的代碼。作者為了更精確的定時(shí),做了一點(diǎn)小小的改進(jìn),把執(zhí)行RDTSC指令的時(shí)間,通過(guò)連續(xù)兩次調(diào)用GetCycleCount函數(shù)計(jì)算出來(lái)并保存了起來(lái),以后每次計(jì)時(shí)結(jié)束后,都從實(shí)際得到的計(jì)數(shù)中減掉這一小段時(shí)間,以得到更準(zhǔn)確的計(jì)時(shí)數(shù)字。但我個(gè)人覺得這一點(diǎn)點(diǎn)改進(jìn)意義不大。在我的機(jī)器上實(shí)測(cè),這條指令大概花掉了幾十到100多個(gè)周期,在 Celeron?800MHz的機(jī)器上,這不過(guò)是十分之一微秒的時(shí)間。對(duì)大多數(shù)應(yīng)用來(lái)說(shuō),這點(diǎn)時(shí)間完全可以忽略不計(jì);而對(duì)那些確實(shí)要精確到納秒數(shù)量級(jí)的應(yīng)用來(lái)說(shuō),這個(gè)補(bǔ)償也過(guò)于粗糙了。

            這個(gè)方法的優(yōu)點(diǎn)是:

            1.高精度。可以直接達(dá)到納秒級(jí)的計(jì)時(shí)精度(在1GHz的CPU上每個(gè)時(shí)鐘周期就是一納秒),這是其他計(jì)時(shí)方法所難以企及的。

            2. 成本低。timeGetTime?函數(shù)需要鏈接多媒體庫(kù)winmm.lib,QueryPerformance*?函數(shù)根據(jù)MSDN的說(shuō)明,需要硬件的支持(雖然我還沒(méi)有見過(guò)不支持的機(jī)器)和KERNEL庫(kù)的支持,所以二者都只能在Windows平臺(tái)下使用(關(guān)于DOS平臺(tái)下的高精度計(jì)時(shí)問(wèn)題,可以參考《圖形程序開發(fā)人員指南》,里面有關(guān)于控制定時(shí)器8253的詳細(xì)說(shuō)明)。但RDTSC指令是一條CPU指令,凡是i386平臺(tái)下Pentium以上的機(jī)器均支持,甚至沒(méi)有平臺(tái)的限制(我相信i386版本UNIX和Linux下這個(gè)方法同樣適用,但沒(méi)有條件試驗(yàn)),而且函數(shù)調(diào)用的開銷是最小的。

            3. 具有和CPU主頻直接對(duì)應(yīng)的速率關(guān)系。一個(gè)計(jì)數(shù)相當(dāng)于1/(CPU主頻Hz數(shù))秒,這樣只要知道了CPU的主頻,可以直接計(jì)算出時(shí)間。這和 QueryPerformanceCount不同,后者需要通過(guò)QueryPerformanceFrequency獲取當(dāng)前計(jì)數(shù)器每秒的計(jì)數(shù)次數(shù)才能換算成時(shí)間。

            這個(gè)方法的缺點(diǎn)是:

            1.現(xiàn)有的C/C++編譯器多數(shù)不直接支持使用RDTSC指令,需要用直接嵌入機(jī)器碼的方式編程,比較麻煩。

            2.數(shù)據(jù)抖動(dòng)比較厲害。其實(shí)對(duì)任何計(jì)量手段而言,精度和穩(wěn)定性永遠(yuǎn)是一對(duì)矛盾。如果用低精度的timeGetTime來(lái)計(jì)時(shí),基本上每次計(jì)時(shí)的結(jié)果都是相同的;而RDTSC指令每次結(jié)果都不一樣,經(jīng)常有幾百甚至上千的差距。這是這種方法高精度本身固有的矛盾。

            關(guān)于這個(gè)方法計(jì)時(shí)的最大長(zhǎng)度,我們可以簡(jiǎn)單的用下列公式計(jì)算:

            自CPU上電以來(lái)的秒數(shù)?=?RDTSC讀出的周期數(shù)?/?CPU主頻速率(Hz)

            64位無(wú)符號(hào)整數(shù)所能表達(dá)的最大數(shù)字是1.8×10^19,在我的Celeron?800上可以計(jì)時(shí)大約700年(書中說(shuō)可以在200MHz的Pentium上計(jì)時(shí)117年,這個(gè)數(shù)字不知道是怎么得出來(lái)的,與我的計(jì)算有出入)。無(wú)論如何,我們大可不必關(guān)心溢出的問(wèn)題。

            下面是幾個(gè)小例子,簡(jiǎn)要比較了三種計(jì)時(shí)方法的用法與精度

            //Timer1.cpp?使用了RDTSC指令的Timer類//KTimer類的定義可以參見《Windows圖形編程》P15
            //編譯行:CL?Timer1.cpp?/link?USER32.lib
            #include?<stdio.h>
            #include?"KTimer.h"
            main()
            {
            ?unsigned?t;
            ?KTimer?timer;
            ?timer.Start();
            ?Sleep(1000);
            ?t?=?timer.Stop();
            ?printf("Lasting?Time:?%d\n",t);
            }

            //Timer2.cpp?使用了timeGetTime函數(shù)
            //需包含<mmsys.h>,但由于Windows頭文件錯(cuò)綜復(fù)雜的關(guān)系
            //簡(jiǎn)單包含<windows.h>比較偷懶:)
            //編譯行:CL?timer2.cpp?/link?winmm.lib?
            #include?<windows.h>
            #include?<stdio.h>

            main()
            {
            ?DWORD?t1,?t2;
            ?t1?=?timeGetTime();
            ?Sleep(1000);
            ?t2?=?timeGetTime();
            ?printf("Begin?Time:?%u\n",?t1);
            ?printf("End?Time:?%u\n",?t2);
            ?printf("Lasting?Time:?%u\n",(t2-t1));
            }

            //Timer3.cpp?使用了QueryPerformanceCounter函數(shù)
            //編譯行:CL?timer3.cpp?/link?KERNEl32.lib
            #include?<windows.h>
            #include?<stdio.h>

            main()
            {
            ?LARGE_INTEGER?t1,?t2,?tc;
            ?QueryPerformanceFrequency(&tc);
            ?printf("Frequency:?%u\n",?tc.QuadPart);
            ?QueryPerformanceCounter(&t1);
            ?Sleep(1000);
            ?QueryPerformanceCounter(&t2);
            ?printf("Begin?Time:?%u\n",?t1.QuadPart);
            ?printf("End?Time:?%u\n",?t2.QuadPart);
            ?printf("Lasting?Time:?%u\n",(?t2.QuadPart-?t1.QuadPart));
            }

            ////////////////////////////////////////////////
            //以上三個(gè)示例程序都是測(cè)試1秒鐘休眠所耗費(fèi)的時(shí)間
            file://測(cè)/試環(huán)境:Celeron?800MHz?/?256M?SDRAM??
            //??????????Windows?2000?Professional?SP2
            //??????????Microsoft?Visual?C++?6.0?SP5
            ////////////////////////////////////////////////

            以下是Timer1的運(yùn)行結(jié)果,使用的是高精度的RDTSC指令
            Lasting?Time:?804586872

            以下是Timer2的運(yùn)行結(jié)果,使用的是最粗糙的timeGetTime?API
            Begin?Time:?20254254
            End?Time:?20255255
            Lasting?Time:?1001

            以下是Timer3的運(yùn)行結(jié)果,使用的是QueryPerformanceCount?API
            Frequency:?3579545
            Begin?Time:?3804729124
            End?Time:?3808298836
            Lasting?Time:?3569712

            參考資料:
            [YUAN?2002]Feng?Yuan?著,英宇工作室?譯,Windows圖形編程,機(jī)械工業(yè)出版社,2002.4.,P15-17

            posted on 2007-01-30 10:14 大龍 閱讀(1045) 評(píng)論(0)  編輯 收藏 引用


            只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問(wèn)   Chat2DB   管理


            久久精品毛片免费观看| 亚洲午夜精品久久久久久人妖| 国产福利电影一区二区三区久久久久成人精品综合 | 99久久国产综合精品五月天喷水| 国产免费久久精品99久久| 99久久无色码中文字幕人妻| 91精品国产高清久久久久久国产嫩草 | 国产成年无码久久久久毛片| 天天综合久久久网| 伊人久久亚洲综合影院| 久久香蕉国产线看观看99| 久久人人添人人爽添人人片牛牛| 嫩草影院久久国产精品| 久久综合给合久久狠狠狠97色 | 欧美牲交A欧牲交aⅴ久久| 久久精品无码一区二区三区日韩 | 久久亚洲国产欧洲精品一| 日韩精品久久久久久久电影蜜臀| 国产视频久久| 久久久久久久尹人综合网亚洲| 狠狠色综合网站久久久久久久高清| 国产精品激情综合久久| 欧美久久精品一级c片片| 久久久久99精品成人片试看| 无码任你躁久久久久久老妇App| 久久九九免费高清视频| 热久久国产精品| 人人狠狠综合久久亚洲婷婷| 精品国际久久久久999波多野| 18岁日韩内射颜射午夜久久成人 | 亚洲AⅤ优女AV综合久久久| 97精品伊人久久久大香线蕉| 久久九九青青国产精品| 精品久久久久久久| 国产高潮久久免费观看| 久久最新精品国产| 久久精品综合一区二区三区| 日日狠狠久久偷偷色综合96蜜桃| 久久人人爽人人爽AV片| 少妇久久久久久被弄到高潮| 精品久久人人爽天天玩人人妻|