青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

醬壇子

專注C++技術 在這里寫下自己的學習心得 感悟 和大家討論 共同進步(歡迎批評!!!)

  C++博客 :: 首頁 :: 聯系 :: 聚合  :: 管理
  66 Posts :: 16 Stories :: 236 Comments :: 0 Trackbacks

公告

王一偉 湖南商學院畢業 電子信息工程專業

常用鏈接

留言簿(19)

我參與的團隊

搜索

  •  

積分與排名

  • 積分 - 390277
  • 排名 - 64

最新隨筆

最新評論

閱讀排行榜

評論排行榜

void?*?memcpy_amd(void?*dest,?const?void?*src,?size_t?n)
{
??__asm?{

mov ecx,?[n] ;?number?of?bytes?to?copy
mov edi,?[dest] ;?destination
mov esi,?[src] ;?source
mov ebx,?ecx ;?keep?a?copy?of?count

cld
cmp ecx,?TINY_BLOCK_COPY
jb $memcpy_ic_3 ;?tiny??skip?mmx?copy

cmp ecx,?32*1024 ;?don't?align?between?32k-64k?because
jbe $memcpy_do_align ;??it?appears?to?be?slower
cmp ecx,?64*1024
jbe $memcpy_align_done
$memcpy_do_align:
mov ecx,?8 ;?a?trick?that's?faster?than?rep?movsb...
sub ecx,?edi ;?align?destination?to?qword
and ecx,?111b ;?get?the?low?bits
sub ebx,?ecx ;?update?copy?count
neg ecx ;?set?up?to?jump?into?the?array
add ecx,?offset?$memcpy_align_done
jmp ecx ;?jump?to?array?of?movsb's

align?4
movsb
movsb
movsb
movsb
movsb
movsb
movsb
movsb

$memcpy_align_done: ;?destination?is?dword?aligned
mov ecx,?ebx ;?number?of?bytes?left?to?copy
shr ecx,?6 ;?get?64-byte?block?count
jz $memcpy_ic_2 ;?finish?the?last?few?bytes

cmp ecx,?IN_CACHE_COPY/64 ;?too?big?4?cache??use?uncached?copy
jae $memcpy_uc_test

//?This?is?small?block?copy?that?uses?the?MMX?registers?to?copy?8?bytes
//?at?a?time.??It?uses?the?"unrolled?loop"?optimization,?and?also?uses
//?the?software?prefetch?instruction?to?get?the?data?into?the?cache.
align?16
$memcpy_ic_1: ;?64-byte?block?copies,?in-cache?copy

prefetchnta?[esi?+?(200*64/34+192)] ;?start?reading?ahead

movq mm0,?[esi+0] ;?read?64?bits
movq mm1,?[esi+8]
movq [edi+0],?mm0 ;?write?64?bits
movq [edi+8],?mm1 ;????note:??the?normal?movq?writes?the
movq mm2,?[esi+16] ;????data?to?cache;?a?cache?line?will?be
movq mm3,?[esi+24] ;????allocated?as?needed,?to?store?the?data
movq [edi+16],?mm2
movq [edi+24],?mm3
movq mm0,?[esi+32]
movq mm1,?[esi+40]
movq [edi+32],?mm0
movq [edi+40],?mm1
movq mm2,?[esi+48]
movq mm3,?[esi+56]
movq [edi+48],?mm2
movq [edi+56],?mm3

add esi,?64 ;?update?source?pointer
add edi,?64 ;?update?destination?pointer
dec ecx ;?count?down
jnz $memcpy_ic_1 ;?last?64-byte?block?

$memcpy_ic_2:
mov ecx,?ebx ;?has?valid?low?6?bits?of?the?byte?count
$memcpy_ic_3:
shr ecx,?2 ;?dword?count
and ecx,?1111b ;?only?look?at?the?"remainder"?bits
neg ecx ;?set?up?to?jump?into?the?array
add ecx,?offset?$memcpy_last_few
jmp ecx ;?jump?to?array?of?movsd's

$memcpy_uc_test:
cmp ecx,?UNCACHED_COPY/64 ;?big?enough??use?block?prefetch?copy
jae $memcpy_bp_1

$memcpy_64_test:
or ecx,?ecx ;?tail?end?of?block?prefetch?will?jump?here
jz $memcpy_ic_2 ;?no?more?64-byte?blocks?left

//?For?larger?blocks,?which?will?spill?beyond?the?cache,?it's?faster?to
//?use?the?Streaming?Store?instruction?MOVNTQ.???This?write?instruction
//?bypasses?the?cache?and?writes?straight?to?main?memory.??This?code?also
//?uses?the?software?prefetch?instruction?to?pre-read?the?data.
align?16
$memcpy_uc_1: ;?64-byte?blocks,?uncached?copy

prefetchnta?[esi?+?(200*64/34+192)] ;?start?reading?ahead

movq mm0,[esi+0] ;?read?64?bits
add edi,64 ;?update?destination?pointer
movq mm1,[esi+8]
add esi,64 ;?update?source?pointer
movq mm2,[esi-48]
movntq [edi-64],?mm0 ;?write?64?bits,?bypassing?the?cache
movq mm0,[esi-40] ;????note:?movntq?also?prevents?the?CPU
movntq [edi-56],?mm1 ;????from?READING?the?destination?address
movq mm1,[esi-32] ;????into?the?cache,?only?to?be?over-written
movntq [edi-48],?mm2 ;????so?that?also?helps?performance
movq mm2,[esi-24]
movntq [edi-40],?mm0
movq mm0,[esi-16]
movntq [edi-32],?mm1
movq mm1,[esi-8]
movntq [edi-24],?mm2
movntq [edi-16],?mm0
dec ecx
movntq [edi-8],?mm1
jnz $memcpy_uc_1 ;?last?64-byte?block?

jmp $memcpy_ic_2 ;?almost?done

//?For?the?largest?size?blocks,?a?special?technique?called?Block?Prefetch
//?can?be?used?to?accelerate?the?read?operations.???Block?Prefetch?reads
//?one?address?per?cache?line,?for?a?series?of?cache?lines,?in?a?short?loop.
//?This?is?faster?than?using?software?prefetch,?in?this?case.
//?The?technique?is?great?for?getting?maximum?read?bandwidth,
//?especially?in?DDR?memory?systems.
$memcpy_bp_1: ;?large?blocks,?block?prefetch?copy

cmp ecx,?CACHEBLOCK ;?big?enough?to?run?another?prefetch?loop?
jl $memcpy_64_test ;?no,?back?to?regular?uncached?copy

mov eax,?CACHEBLOCK?/?2 ;?block?prefetch?loop,?unrolled?2X
add esi,?CACHEBLOCK?*?64 ;?move?to?the?top?of?the?block
align?16
$memcpy_bp_2:
mov edx,?[esi-64] ;?grab?one?address?per?cache?line
mov edx,?[esi-128] ;?grab?one?address?per?cache?line
sub esi,?128 ;?go?reverse?order
dec eax ;?count?down?the?cache?lines
jnz $memcpy_bp_2 ;?keep?grabbing?more?lines?into?cache

mov eax,?CACHEBLOCK ;?now?that?it's?in?cache,?do?the?copy
align?16
$memcpy_bp_3:
movq mm0,?[esi???] ;?read?64?bits
movq mm1,?[esi+?8]
movq mm2,?[esi+16]
movq mm3,?[esi+24]
movq mm4,?[esi+32]
movq mm5,?[esi+40]
movq mm6,?[esi+48]
movq mm7,?[esi+56]
add esi,?64 ;?update?source?pointer
movntq [edi???],?mm0 ;?write?64?bits,?bypassing?cache
movntq [edi+?8],?mm1 ;????note:?movntq?also?prevents?the?CPU
movntq [edi+16],?mm2 ;????from?READING?the?destination?address?
movntq [edi+24],?mm3 ;????into?the?cache,?only?to?be?over-written,
movntq [edi+32],?mm4 ;????so?that?also?helps?performance
movntq [edi+40],?mm5
movntq [edi+48],?mm6
movntq [edi+56],?mm7
add edi,?64 ;?update?dest?pointer

dec eax ;?count?down

jnz $memcpy_bp_3 ;?keep?copying
sub ecx,?CACHEBLOCK ;?update?the?64-byte?block?count
jmp $memcpy_bp_1 ;?keep?processing?chunks

//?The?smallest?copy?uses?the?X86?"movsd"?instruction,?in?an?optimized
//?form?which?is?an?"unrolled?loop".???Then?it?handles?the?last?few?bytes.
align?4
movsd
movsd ;?perform?last?1-15?dword?copies
movsd
movsd
movsd
movsd
movsd
movsd
movsd
movsd ;?perform?last?1-7?dword?copies
movsd
movsd
movsd
movsd
movsd
movsd

$memcpy_last_few: ;?dword?aligned?from?before?movsd's
mov ecx,?ebx ;?has?valid?low?2?bits?of?the?byte?count
and ecx,?11b ;?the?last?few?cows?must?come?home
jz $memcpy_final ;?no?more,?let's?leave
rep movsb ;?the?last?1,?2,?or?3?bytes

$memcpy_final:?
emms ;?clean?up?the?MMX?state
sfence ;?flush?the?write?buffer
mov eax,?[dest] ;?ret?value?=?destination?pointer

????}
}

posted on 2007-01-02 14:12 @王一偉 閱讀(1366) 評論(2)  編輯 收藏 引用

Feedback

# re: amd的Memcpy函數 2007-12-29 16:44 Solomon Joh
弓雖!全是asm啊,頭大中……  回復  更多評論
  

# re: amd的Memcpy函數 2007-12-30 08:04 @王一偉
呵呵 粘帖過來的 還沒來得及研究呢
有時間研究下可以探討探討

指令一般般多拉 哈哈  回復  更多評論
  


只有注冊用戶登錄后才能發表評論。
網站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            最新国产成人在线观看| 亚洲精品韩国| 久久人人九九| 久久先锋影音av| 亚洲国产乱码最新视频| 看片网站欧美日韩| 欧美成在线视频| 亚洲一区二区动漫| 欧美一区二区三区免费大片| 国产亚洲a∨片在线观看| 久久久免费精品视频| 久久久久久久一区二区三区| 亚洲茄子视频| 亚洲综合欧美日韩| 伊人久久婷婷| 妖精视频成人观看www| 国产毛片久久| 欧美高清hd18日本| 欧美性视频网站| 久久三级福利| 欧美日韩www| 久久久www成人免费精品| 另类尿喷潮videofree| 亚洲影院色在线观看免费| 性欧美xxxx视频在线观看| 亚洲经典三级| 性欧美18~19sex高清播放| 91久久在线视频| 午夜国产精品视频免费体验区| 伊甸园精品99久久久久久| 亚洲精品免费看| 国产网站欧美日韩免费精品在线观看| 欧美顶级少妇做爰| 国产精品色一区二区三区| 亚洲第一网站免费视频| 国产日韩欧美精品在线| 亚洲精品人人| 影音先锋中文字幕一区| 亚洲一区在线视频| 日韩一级欧洲| 久久性天堂网| 久久婷婷久久| 国产精品日产欧美久久久久| 亚洲国产精品久久久久秋霞不卡| 国产欧美日韩综合一区在线播放| 亚洲国产精品毛片| 精品二区视频| 午夜国产欧美理论在线播放| 夜夜爽夜夜爽精品视频| 美女视频黄免费的久久| 久久精品国产一区二区三区| 欧美性理论片在线观看片免费| 欧美激情性爽国产精品17p| 国产一区二区三区四区三区四| 亚洲性感激情| 亚洲伊人久久综合| 欧美日韩国产va另类| 亚洲人成毛片在线播放| 在线欧美影院| 久久五月婷婷丁香社区| 久久亚洲综合网| 一区二区在线观看视频在线观看| 亚洲欧美日韩专区| 午夜精品影院在线观看| 国产精品久久久久久一区二区三区 | 亚洲一二三区视频在线观看| 夜夜狂射影院欧美极品| 欧美日本一区二区三区| 最新亚洲电影| 中文国产成人精品久久一| 欧美久久婷婷综合色| 亚洲国产精彩中文乱码av在线播放| 樱花yy私人影院亚洲| 久久久久久尹人网香蕉| 美女脱光内衣内裤视频久久影院 | 在线播放国产一区中文字幕剧情欧美 | 亚洲国产精品v| 亚洲人成人77777线观看| 欧美大片在线看| 亚洲精品欧洲| 性亚洲最疯狂xxxx高清| 国内精品国语自产拍在线观看| 久久精品国产成人| 欧美成人中文字幕| 亚洲精品欧美专区| 欧美视频一二三区| 午夜视频在线观看一区二区| 久久综合久久综合久久综合| 亚洲国产精品欧美一二99| 欧美片在线观看| 亚洲天堂av综合网| 久久久久久午夜| 亚洲国产aⅴ天堂久久| 欧美日韩精品一区| 亚洲欧美日韩高清| 欧美二区在线| 亚洲男人第一网站| 伊人精品在线| 欧美亚韩一区| 老牛影视一区二区三区| 99re8这里有精品热视频免费 | 欧美一区二区播放| 在线日韩成人| 欧美午夜精品理论片a级大开眼界 欧美午夜精品理论片a级按摩 | 欧美aaa级| 亚洲一区二区免费视频| 伊人男人综合视频网| 欧美三级欧美一级| 久久这里有精品15一区二区三区| 99精品国产福利在线观看免费| 久久亚洲免费| 亚洲一区在线观看免费观看电影高清| 红杏aⅴ成人免费视频| 欧美日韩午夜剧场| 蜜桃伊人久久| 欧美在线不卡| 亚洲午夜精品久久久久久浪潮| 欧美电影电视剧在线观看| 欧美影院一区| 亚洲在线一区二区三区| 亚洲美女视频| 91久久久久久| 黄色国产精品| 国产欧美精品一区二区三区介绍| 欧美刺激午夜性久久久久久久| 久久精品五月| 性欧美精品高清| 亚洲一区二区三区中文字幕在线| 亚洲人成在线观看| 欧美国产视频在线观看| 久久综合国产精品台湾中文娱乐网| 亚洲神马久久| 一本色道久久综合| 99国产精品99久久久久久| 亚洲二区在线| 亚洲风情亚aⅴ在线发布| 国语自产精品视频在线看8查询8 | 国产精品丝袜久久久久久app| 欧美精品色网| 欧美精品videossex性护士| 美日韩精品视频| 免费欧美在线视频| 蜜桃av噜噜一区二区三区| 久久在线免费| 欧美成人一二三| 欧美大色视频| 欧美日韩喷水| 欧美亚州韩日在线看免费版国语版| 欧美日韩伦理在线| 欧美体内谢she精2性欧美| 国产精品久久97| 国产精品揄拍500视频| 国产情人节一区| 黄色综合网站| 最新69国产成人精品视频免费| 91久久久在线| 日韩午夜免费| 亚洲在线一区二区三区| 久久国产欧美| 蜜臀久久99精品久久久久久9| 欧美国产三级| 日韩视频永久免费| 亚洲在线1234| 久久米奇亚洲| 欧美日韩一区二区视频在线| 国产裸体写真av一区二区| 激情婷婷久久| 99热这里只有精品8| 西西人体一区二区| 免费观看国产成人| 91久久精品www人人做人人爽| 亚洲人午夜精品免费| 亚洲网站视频| 久久久久这里只有精品| 欧美日韩国产一区| 国产美女精品视频免费观看| 在线欧美影院| 午夜激情一区| 欧美国产精品日韩| 在线亚洲免费视频| 久久久天天操| 国产精品乱码久久久久久| 在线观看日韩精品| 亚洲综合色网站| 欧美国产日本韩| 亚洲综合导航| 欧美日韩精品高清| 一区二区三区亚洲| 午夜在线精品偷拍| 亚洲国产精品久久久久秋霞影院| 亚洲欧美日韩国产综合在线 | 久久午夜影视| 国产精品欧美一区喷水| 最新中文字幕亚洲| 欧美一级淫片播放口| 亚洲经典自拍| 久久久美女艺术照精彩视频福利播放| 欧美日韩一区在线| 亚洲黄色影院| 久久只精品国产|