INTEL CPU全系列架構(gòu)發(fā)展史及深度測(cè)試!
轉(zhuǎn)自http://hi.baidu.com/miracleconf/item/bf8f0a0fc84b47c6905718da (peakflys注:此鏈接也為轉(zhuǎn)帖,原帖地址未知)

壯士斷腕,Conroe臨危受命
在很久很久以前的286時(shí)代,英特爾還只是一個(gè)小公司,它負(fù)責(zé)給IBM提供IBM PC中的微處理器。那會(huì)兒,IBM PC銷量很大,兼容機(jī)還沒出現(xiàn)。為了能保證微處理器供貨充足,上帝般的IBM強(qiáng)迫英特爾將微處理器技術(shù)無償授權(quán)給另一家公司。看IBM臉色吃飯的英特爾雖然老大不愿意但也沒辦法,最后選擇了AMD作為微處理器技術(shù)無償提供對(duì)象(一不小心養(yǎng)虎成患,現(xiàn)在英特爾估計(jì)后悔到死)。為了制約AMD,英特爾又將微處理器技術(shù)無償授權(quán)給了Cyrix。

1982年2月1日,英特爾推出80286微處理器 在當(dāng)時(shí)來說,英特爾除了產(chǎn)能占優(yōu)外,在技術(shù)上是沒有任何優(yōu)勢(shì)的,三家公司的微處理器架構(gòu)基本一致。但是這時(shí)候,IBM公司內(nèi)部倒產(chǎn)生了巨大的分歧:許多人反對(duì)快速轉(zhuǎn)換到286計(jì)算機(jī)的生產(chǎn)和銷售,因?yàn)檫@會(huì)對(duì)IBM的小型機(jī)與之前的PC XT銷售造成影響,他們希望過渡的步伐能慢一些。
但英特爾并不能等,80286處理器已經(jīng)批量生產(chǎn)了,不可能堆在倉庫里等IBM慢慢消化。此時(shí)康柏公司就鉆了空子——快速推出286的IBM PC兼容機(jī),并一舉打敗IBM成為PC市場(chǎng)的新霸主。隨著IBM PC兼容機(jī)的大量涌現(xiàn),英特爾處理器也賣得越來越多,名氣越來越大,實(shí)力與日俱增,也就不用再唯IBM馬首是瞻了。
1993年3月22日,英特爾發(fā)布新一代P5架構(gòu)586微處理器,這款歷史性的產(chǎn)品被英特爾命名為Pentium(奔騰),并不再對(duì)AMD和Cyrix授權(quán)。

1993.3.22 英特爾推出里程碑式的Pentium處理器 而AMD也非昔日可比了,它具有很強(qiáng)的研發(fā)能力,并很快發(fā)布了K6處理器迎戰(zhàn),更逐漸衍生出K6-2和K6-3處理器。K6-2處理器憑借架構(gòu)上的優(yōu)勢(shì)令英特爾感到了巨大的壓力。為此1995年英特爾又推出新的P6架構(gòu)取代奔騰/奔騰MMX的P5架構(gòu),以求在性能上保持領(lǐng)先地位。

1995.11.1 英特爾推出采用P6架構(gòu)的Pentium Pro 最早采用P6架構(gòu)的微處理器是高能奔騰(Pentium Pro)。P6架構(gòu)與奔騰的P5架構(gòu)最大的不同在于,過去集成在主板上的二級(jí)緩存被整合到處理器內(nèi),從而大大地加快了數(shù)據(jù)讀取時(shí)間和提高命中率。另外,P6架構(gòu)是一個(gè)純32位的微處理器架構(gòu)。

1997.4.7 英特爾推出Pentium II 為了將P6架構(gòu)平價(jià)化,以對(duì)抗AMD等競(jìng)爭(zhēng)對(duì)手,英特爾采用了將二級(jí)緩存從CPU核心移出,改用外置于集成CPU核心的PCB板上的做法, 這“萌生”了1997年推出的奔騰II處理器。奔騰II處理器的二級(jí)緩存外置于CPU核心以外,只能以處理器工作主頻一半的速度運(yùn)行,而不像奔騰Pro的二級(jí)緩存那樣以全速運(yùn)行。隨著0.25微米工藝的成熟,英特爾才嘗試重新將二級(jí)緩存集成在核心內(nèi)。
為了進(jìn)一步鞏固自己的領(lǐng)導(dǎo)地位,英特爾1999年1月推出了PentiumIII。
1999.1 英特爾推出PentiumIII 在PentiumIII時(shí)代之前,AMD和Cyrix一直是英特爾的追隨者,但是AMD Athlon推出之后,歷史發(fā)生了微妙的變化:在AMD推出Athlon 650MHz的時(shí)候,英特爾處理器的最高主頻才550MHz,這也是英特爾第一次被競(jìng)爭(zhēng)對(duì)手超過!為了保住自己顏面,英特爾匆匆推出了采用0.18微米工藝,代號(hào)"Coppermine"的奔騰III處理器,主頻有500MHz至700MHz幾個(gè)型號(hào)。 這時(shí)候英特爾與AMD主頻之爭(zhēng)的激烈程度前所未有,我們熟悉的頻率“攀比”戰(zhàn)開始了。 最先達(dá)到1GHz主頻的是AMD的Athlon處理器,同頻的奔騰III處理器在落后不到一個(gè)月面世,但這足以讓AMD自豪了。由于1GHz的Athlon性能不敵1GHz奔騰III,AMD決定開發(fā)核心整合二級(jí)緩存的Athlon XP。 隨后英特爾霸王硬上弓,搶先推出1.13GHz的奔騰III,在性能上領(lǐng)先倒是領(lǐng)先了,但當(dāng)時(shí)的0.18微米工藝生產(chǎn)1.13GHz的奔騰III實(shí)在是勉為其難。后果就是全面回收幾乎不能正常運(yùn)行的奔騰III 1.13GHz處理器。而此時(shí),AMD推出了1.1GHz Athlon XP處理器。◆ 飽受責(zé)難的NetBurst架構(gòu)奔騰4
2000.11.20 英特爾推出Pentium4 英特爾在AMD強(qiáng)大的壓力下,開始鼓吹“唯主頻論”。在奔騰III及以前的微處理器時(shí)代,是一個(gè)處理器性能與主頻緊密結(jié)合的時(shí)代。那個(gè)時(shí)候無論是英特爾還是AMD,他們的處理器產(chǎn)品在主頻提升的同時(shí),同樣也會(huì)帶來相應(yīng)的性能提升。到了奔騰4,英特爾的“唯主頻論”顛覆了“性能等于主頻”的傳統(tǒng)觀念。
2000年11月20日,英特爾正式發(fā)布了NetBurst架構(gòu)的奔騰4。這不僅僅是一款新產(chǎn)品的發(fā)布,它還標(biāo)志著一個(gè)處理器新時(shí)代的開始。奔騰4 1.4 GHz/1.5 GHz的出現(xiàn),吸引了全世界的眼光。然而有專業(yè)媒體質(zhì)疑:為何奔騰4的主頻這么高,但是實(shí)際測(cè)試項(xiàng)目很多都不如P6架構(gòu)的1GHz奔騰III呢?英特爾回答:奔騰4是一種全新的架構(gòu),它的性能不能再用傳統(tǒng)的觀點(diǎn)去評(píng)判。
奔騰4能夠在同樣的0.18微米工藝下輕松達(dá)到2GHz,而奔騰III 去到1.13GHz就已經(jīng)到了極限,這是因?yàn)楸简v4的運(yùn)算流水管線多達(dá)20級(jí)甚至31級(jí),而奔騰III只有11級(jí)。運(yùn)算流水管線越長,就越容易在同樣制造工藝下達(dá)到更高的工作主頻。Athlon在同樣制造工藝下可以達(dá)到奔騰III難以達(dá)到的高主頻,就是因?yàn)锳thlon的運(yùn)算流水管線比奔騰III略長。但是運(yùn)算流水管線過長也會(huì)帶來負(fù)面影響,管線越長,單位主頻下的處理器執(zhí)行效率就越低,性能的發(fā)揮就會(huì)受到影響。 第二代Northwood核心的奔騰4采用了0.13微米工藝制造,較好地解決了發(fā)熱與功耗的問題,迅速成為市場(chǎng)主流。此后隨著800MHz FSB、超線程等新技術(shù)的引入,Pentium 4 NetBurst架構(gòu)的威力的以充分發(fā)揮,所以從性能/功耗上來講,這個(gè)時(shí)候的奔騰4達(dá)到了巔峰。 隨著主頻的不斷攀升,NetBurst架構(gòu)的弊端越來越明顯。第三代Prescott奔騰4流水線達(dá)到31級(jí),晶體管達(dá)到了125百萬個(gè)(Northwood只有55百萬個(gè)),以至于它每個(gè)時(shí)鐘周期比Northwood多產(chǎn)生大約60%的熱量,同時(shí)功率消耗也增加大約10%!3.2GHz的Prescott TDP達(dá)到了觸目驚心的103W!人們開始戲稱Pentium 4為烤爐,高主頻帶來的高功耗使得英特爾的忠實(shí)支持者要為奔騰的芯付出更多的電費(fèi),同時(shí)更要忍受高性能處理器風(fēng)扇所帶來的巨大噪音…… 
64歲的英特爾總裁貝瑞特面對(duì)著6500人驚天一跪:“請(qǐng)?jiān)徫覀?#8221;(2004.10) 奔騰4最終止步于3.8GHz,原計(jì)劃推出的4GHz奔騰4處理器也被胎死腹中。英特爾意識(shí)到處理器研發(fā)道路上走入了“唯主頻論”的誤區(qū),2004年10月,英特爾總裁貝瑞特驚天一跪,面對(duì)著6500人說道:“請(qǐng)?jiān)徫覀?#8221;,真心地對(duì)公司的失誤表示懺悔。
英特爾終于承認(rèn)自己錯(cuò)了。不要忘記當(dāng)初英特爾發(fā)布奔騰4時(shí)吹噓說奔騰4是為10GHz的運(yùn)算速度設(shè)計(jì)的,這是到目前為止英特爾歷史上最重要的或許也是最廣為人知的工程失敗事件。
◆ 臨危受命的Core微架構(gòu) 實(shí)際上,英特爾除了擁有NetBurst研發(fā)小組外,還有一支位于以色列海法的研發(fā)團(tuán)隊(duì)。該以色列團(tuán)隊(duì)早在2003年就因?yàn)樵O(shè)計(jì)出兼具高性能與低功耗的Banias移動(dòng)處理器而聞名天下,Core微架構(gòu)是他們最新的杰作,由于NetBurst架構(gòu)的失敗,Core微架構(gòu)一下就成了英特爾的救命符。 2006年3月英特爾在春季IDF大會(huì)宣布下一代處理器將采用的Core微架構(gòu)。英特爾指出未來處理器的技術(shù)發(fā)展重點(diǎn)將是“每瓦特性能”(Performance per Watt)。而這屆IDF的主題更加明確:功耗最優(yōu)化平臺(tái)(Power-Optimized Platforms)。根據(jù)英特爾的說法,采用Core微架構(gòu)的處理器將在性能方面得到極大的飛躍,肯定將超過競(jìng)爭(zhēng)對(duì)手AMD的產(chǎn)品。 更好的消息Core在功耗方面將比前任大幅下降。
Core微架構(gòu)將一統(tǒng)江湖 Core微架構(gòu)被英特爾推上前臺(tái),被賦予了取代NetBurst微架構(gòu)、一統(tǒng)桌面、移動(dòng)與服務(wù)器平臺(tái)的歷史使命。針對(duì)筆記本、桌面級(jí)用戶和服務(wù)器,Core均有不同的產(chǎn)品。
Conroe是基于Core微架構(gòu)的桌面平臺(tái)級(jí)產(chǎn)品(我們常說的“扣肉”),由于“Core”和“Conroe”兩個(gè)單詞在結(jié)構(gòu)上頗為類似,因此有不少消費(fèi)者往往便認(rèn)為“Core”和“Conroe”指得是同樣一種產(chǎn)品。實(shí)際上,我們通常把“Core”直接音譯為“酷睿”,它是Intel新一代處理器產(chǎn)品統(tǒng)一采用的微架構(gòu),而Conroe(扣肉)只是對(duì)基于Core(酷睿)微架構(gòu)的桌面平臺(tái)級(jí)產(chǎn)品。
除桌面的Conroe處理器之外,Core微架構(gòu)還包括代號(hào)為“Merom”的移動(dòng)平臺(tái)處理器和代號(hào)為“Woodcrest”的服務(wù)器平臺(tái)處理器。

由于上一代采用Yonah微架構(gòu)的處理器產(chǎn)品被命名為Intel Core Duo,因此為了便于與前代雙核處理器區(qū)分,Conroe以及Merom都將采用相同的命名方式——Core 2 Duo。另外,Intel最高性能的桌面服務(wù)器芯片Woodcrest將命名為Core 2 Extreme,以區(qū)分于普通桌面/筆記本處理器產(chǎn)品。
Conroe處理器沿用了L1 Cache設(shè)計(jì),L1數(shù)據(jù)Cache和L1指令Cache分別為32KB,兩個(gè)核心共享4MB或2MB的L2 Cache,它結(jié)合了Pentium M高效率和NetBurst動(dòng)態(tài)執(zhí)行性能優(yōu)越兩方面的優(yōu)點(diǎn)。Conroe處理器的數(shù)據(jù)流水線長度從Prescott的31級(jí)大幅度縮短至目前的14級(jí)。其算術(shù)邏輯運(yùn)算單元ALU數(shù)量由上代NetBurst微構(gòu)架的2組提升至3組,同時(shí)在Cache構(gòu)架上也經(jīng)過了大幅度的改良,整體運(yùn)算性能大大增加。

Core微架構(gòu)與Yonah微架構(gòu) 目前比較普遍的看法是,Core微架構(gòu)是Pentium Pro架構(gòu),或者說是P6微架構(gòu)的延續(xù)。Core微架構(gòu)中只有預(yù)取機(jī)制是從NetBurst微架構(gòu)獲得的靈感,所有其它的設(shè)計(jì)都是從Yonah微架構(gòu)(Core Duo處理器)演變而來,而Yonah微架構(gòu)是從Banias處理器和Dothan處理器演變而來的。所有Banias、Dothan、Yonah和采用Core微架構(gòu)的處理器都繼承了NetBurst處理器的前端總線設(shè)計(jì),但除此之外,它們毫無疑問都是曾經(jīng)獲得巨大成功的P6微架構(gòu)的后代。
英特爾P6微架構(gòu)的總工程師之一Robert Colwell在其回憶錄中表示他之所以離開英特爾,主要就是因?yàn)樗⒉徽J(rèn)同英特爾在NetBurst微架構(gòu)中所選擇的設(shè)計(jì)路線,因?yàn)樗嘈?#8220;The future is mobile”,如何在維持省電與最長電池續(xù)航能力的前提下,達(dá)到足夠的運(yùn)算效能,才是處理器技術(shù)發(fā)展的未來方向。NetBurst微架構(gòu)的失敗,與P6微架構(gòu)的復(fù)興,恰恰證明了英特爾之前策略的失敗和他的遠(yuǎn)見。
不過這并不意味著只是把Yonah處理器的一些功能單元和解碼器重新包裝一下然后換了個(gè)名字就推出來。英特爾Core開發(fā)人員稱,Woodcrest、Conroe和Merom處理器都是基于Yonah處理器的,但是幾乎80%的架構(gòu)和電路設(shè)計(jì)需要重新進(jìn)行。
2006.7.27 英特爾Conroe全球同步上海發(fā)布會(huì) 2006年7月27日,英特爾全球同步發(fā)布基于其Core微架構(gòu)的Conroe桌面平臺(tái)處理器,承接6月發(fā)布的服務(wù)器處理器Woodcrest,以及8月登場(chǎng)的筆記本處理器Merom,英特爾處理器全面從上一代NetBurst微架構(gòu)轉(zhuǎn)向新的Core微架構(gòu)。
◆ 解讀Core微架構(gòu)
英特爾對(duì)Core微架構(gòu)的要求非常高,需要有很好的跨平臺(tái)性,又要兼顧到功耗,最重要的是能提供更高的性能。其中特別引人注意的就是英特爾在Core設(shè)計(jì)中導(dǎo)入的全新的每瓦特效率的設(shè)計(jì)概念,因?yàn)檫@個(gè)概念的出現(xiàn)將真正影響未來英特爾處理器架構(gòu)的發(fā)展,而這也對(duì)產(chǎn)業(yè)發(fā)展產(chǎn)生了重大的影響。
Core微架構(gòu)的目標(biāo)就是構(gòu)建一個(gè)高效的雙核心架構(gòu),因此采取共享式二級(jí)緩存設(shè)計(jì),2個(gè)核心共享二級(jí)緩存。內(nèi)核采用高效的14級(jí)有效流水線設(shè)計(jì),每個(gè)核心內(nèi)建4組指令解碼單元,支持微指令融合與宏指令融合技術(shù),每個(gè)時(shí)鐘周期最多可以解碼5條X86指令,并擁有改進(jìn)的分支預(yù)測(cè)功能。每個(gè)核心內(nèi)建5個(gè)執(zhí)行單元,執(zhí)行資源龐大。采用新的內(nèi)存相關(guān)性預(yù)測(cè)技術(shù)。支持增強(qiáng)的電源管理功能。支持硬件虛擬化技術(shù)和硬件防病毒功能。內(nèi)建數(shù)字溫度傳感器。還可提供功率報(bào)告和溫度報(bào)告等,配合系統(tǒng)實(shí)現(xiàn)動(dòng)態(tài)的功耗控制和散熱控制。
重要的一點(diǎn)是,Core微架構(gòu)加入了對(duì)EM64T指令集的支持,隨著Windows Vista的到來以及Intel、AMD全面更換到64bit處理器,64bit計(jì)算的普及只是時(shí)間問題。
·14級(jí)指令執(zhí)行流水線設(shè)計(jì)

流水線深度一直是影響處理器效率的重要因素,流水線深度的增加可以讓處理器時(shí)鐘頻率進(jìn)一步提高,但帶來的反面影響就是處理器的單周期執(zhí)行效率降低、發(fā)熱量上升,同時(shí)容易產(chǎn)生分支預(yù)測(cè)等問題,Prescott核心的P4達(dá)到了31級(jí)流水線長度,要比當(dāng)年的Pentium III和Athlon處理器高出許多,也讓Prescott最終走上失敗之路。
在Core架構(gòu)中,其指令流水線深度達(dá)到14級(jí),這個(gè)深度是要高于Pentium M的12級(jí),但是卻比AMD的K8處理器架構(gòu)的17級(jí)要低上3級(jí)。目前的Core架構(gòu)是兼顧執(zhí)行效率和降低功耗的折中設(shè)計(jì)。
流水線的“條數(shù)”與“級(jí)數(shù)”是完全不同的概念。能夠完整執(zhí)行各種指令的一系列功能單元組成“一條”流水線。而關(guān)于流水線級(jí)數(shù),可以這樣簡(jiǎn)單理解:一條流水線所包含的功能單元一般可以被劃分為多個(gè)部分,它可以被劃分成幾個(gè)部分,就稱這條流水線是“幾級(jí)”的。 Core微架構(gòu)的14級(jí)有效流水線與Prescott核心的31級(jí)有效流水線的對(duì)比,也只有參考意義。那些僅僅根據(jù)這個(gè)數(shù)字的對(duì)比就斷言Core微架構(gòu)只能達(dá)到很低的頻率的說法是不具有足夠的說服力的。Conroe XE 3.33GHz處理器的存在已經(jīng)讓很多相信這個(gè)說法的人大吃一驚。而實(shí)際上,已經(jīng)有很多玩家在風(fēng)冷下將Conroe處理器超頻達(dá)到4GHz以上的頻率。 除此之外,Core微架構(gòu)加入了五大重要?jiǎng)?chuàng)新,其中包括寬區(qū)動(dòng)態(tài)執(zhí)行(Intel Wide Dynamic Execution)、高級(jí)智能高速緩存(Intel Adcanced Smart Cache)、智能內(nèi)存訪問(Intel Smart Memory Acess)及高級(jí)數(shù)字媒體增強(qiáng)技術(shù)(Intel Adcanced Digital Media Boost)、智能功率能力(Intel Intelligent Power Capability),這里我們就只是對(duì)這五大重要?jiǎng)?chuàng)新作個(gè)簡(jiǎn)單介紹: ·寬區(qū)動(dòng)態(tài)執(zhí)行(intel Wide Dynamic Execution)
寬區(qū)動(dòng)態(tài)執(zhí)行(Intel Wide Dynamic Execution)技術(shù)就是通過提升每個(gè)時(shí)鐘周期完成的指令數(shù),從而顯著改進(jìn)執(zhí)行能力。通俗的說就是,每個(gè)內(nèi)核將變得更加“寬闊”,這樣每個(gè)內(nèi)核就可以同時(shí)處理更多的指令。

毫無疑問,Core微架構(gòu)是一個(gè)比NetBurst或Yonah微架構(gòu)更寬的設(shè)計(jì)。Core微架構(gòu)擁有4組解碼單元,每周期可以生成7條微指令;Yonah 微架構(gòu)擁有3組,每周期可以生成6條微指令;而NetBurst微架構(gòu)由于解碼方式不同,不容易比較解碼單元的數(shù)目,但是NetBurst微架構(gòu)每周期只能生成3條微指令。
Core微架構(gòu)把解碼單元增加到4組,這個(gè)變化可以說是Core微架構(gòu)最大的特色之一。X86指令集的指令長度、格式與定址模式都相當(dāng)混亂,導(dǎo)致X86指令解碼器的設(shè)計(jì)是非常困難的。增加解碼單元,特別是復(fù)雜解碼單元,固然會(huì)大大增強(qiáng)處理器的解碼能力,但是解碼單元復(fù)雜的電路也必然會(huì)提高內(nèi)核的復(fù)雜度和處理器的功耗。權(quán)衡利弊,英特爾最終選擇了增加1組簡(jiǎn)單解碼單元的折衷方案。
此外,Core架構(gòu)的每個(gè)核心都擁有3個(gè)算術(shù)邏輯單元(ALU),而之前的NetBurst僅有2個(gè)ALU,P6架構(gòu)的處理器僅為1個(gè),這樣的設(shè)計(jì)使得Core架構(gòu)擁有比較高的處理能力。
酷睿微體系結(jié)構(gòu)在提升每個(gè)時(shí)鐘周期的指令數(shù)方面做了很多努力,例如新加入宏融合(Macro-Fusion)技術(shù),它可以讓處理器在解碼的同時(shí),將同類的指令融合為單一的指令,這樣可以減少處理的指令總數(shù),讓處理器在更短的時(shí)間內(nèi)處理更多的指令。酷睿架構(gòu)也改良了ALU以支持宏融合技術(shù)。
·高級(jí)智能高速緩存(Intel Advanced Smart Cache)

以往的多核心處理器,其每個(gè)核心的L2緩存是各自獨(dú)立的,這就造成了L2緩存不能夠被充分利用,并且兩個(gè)核心之間的數(shù)據(jù)交換路線也更為冗長,影響了處理器工作效率。如果采用L2緩存共享設(shè)計(jì),那么只需要數(shù)據(jù)被載入到L2緩存中,數(shù)據(jù)可以被兩個(gè)核心同時(shí)使用。 這樣做的另一個(gè)好處是每個(gè)內(nèi)核之間都共享著更大的L2緩存,其緩存可以被任何一個(gè)核心所獨(dú)占,這樣理論上每個(gè)核心都有可能獲得100%的L2緩存掌控權(quán),特別是對(duì)于一些單核心優(yōu)化的程序,由于不需要使用到第二個(gè)核心,這種時(shí)候,第二個(gè)核心自動(dòng)關(guān)閉降低功耗,而第一個(gè)核心可以共享雙倍于單核L2緩存容量的空間來存放數(shù)據(jù),要知道高速L2緩存的容量越大,可以使得總體效率也有響應(yīng)提升。 ·智能內(nèi)存訪問(Intel Smart Memory Access)

智能內(nèi)存訪問是另一個(gè)能夠提高系統(tǒng)性能的特性,通過縮短內(nèi)存延遲來優(yōu)化內(nèi)存數(shù)據(jù)訪問。智能內(nèi)存訪問能夠預(yù)測(cè)系統(tǒng)的需要,從而提前載入或預(yù)取數(shù)據(jù),反映到用戶的直接使用體驗(yàn)上,就是大幅提高了執(zhí)行程序的效率。 以前我們要從內(nèi)存中讀取數(shù)據(jù),就需要等待處理器完成前面的所以指令后才可以進(jìn)行,這樣的效率顯然是低下的。而Core架構(gòu)中可以智能地預(yù)測(cè)和裝載下一條指令所需要的數(shù)據(jù),從而優(yōu)化內(nèi)存子系統(tǒng)對(duì)可用數(shù)據(jù)帶寬的使用,并隱藏內(nèi)存訪問的延遲。該目標(biāo)是為了確保能夠盡快地使用數(shù)據(jù),并使該數(shù)據(jù)可能地用于需要的地方,以將延遲最小化,最終提高效率和速度。 智能內(nèi)存訪問包含一項(xiàng)重要的被稱作內(nèi)存消歧(Memory DisaMBIguATIon)的新能力,該能力提高了亂序處理的效率,因?yàn)樗梢詾閳?zhí)行內(nèi)核提供內(nèi)建的智能,以幫助其在執(zhí)行完所有預(yù)先存儲(chǔ)的指令前,預(yù)測(cè)性地載入指令即將需要執(zhí)行的數(shù)據(jù)。除內(nèi)存消歧外,英特爾智能內(nèi)存訪問還包含增強(qiáng)的預(yù)取器。預(yù)取器負(fù)責(zé)“預(yù)取”內(nèi)存內(nèi)容,并將其放入高速緩存中,以備讀取。增加從高速緩存而非內(nèi)存的裝載量將縮短內(nèi)存延遲并提高性能。 總之,改進(jìn)的預(yù)取器和內(nèi)存消歧通過最大化可用系統(tǒng)總線帶寬和隱藏內(nèi)存子系統(tǒng)延遲,提高了執(zhí)行吞吐率。 ·高級(jí)數(shù)字媒體增強(qiáng)技術(shù)(Intel Advanced Digital Media Boost)

性能=頻率×每個(gè)時(shí)鐘周期的指令數(shù),英特爾高級(jí)數(shù)字媒體增強(qiáng)是為了提高每個(gè)時(shí)鐘周期的指令數(shù)而誕生。它是一項(xiàng)可以顯著提高執(zhí)行SIMD流指令擴(kuò)展(SSE)指令性能的特性。128位SIMD整數(shù)算法和128位SIMD雙精度浮點(diǎn)操作減少了執(zhí)行特定程序任務(wù)所需的全部指令數(shù),將能夠促使整體性能的增高。
Core微架構(gòu)的上一代Yonah具有一個(gè)比較明顯的缺點(diǎn),只具有64bit的SIMD運(yùn)算架構(gòu),在涉及到128位SIMD運(yùn)算的時(shí)候,需要兩個(gè)時(shí)鐘周期才能完成,效率非常低下,Yonah也因此難以實(shí)現(xiàn)64bit運(yùn)算,而Core微架構(gòu)經(jīng)過改良之后,可以單個(gè)周期就能完成同樣的操作,效率提高達(dá)一倍。Intel配合這個(gè)改進(jìn),并結(jié)合新的SSE3指令集,并稱為Intel Advanced Digital Media Boost。
·智能功率能力(Intel Intelligent Power Capability)


NetBurst架構(gòu)、Prescott核心處理器的耗電/功耗表現(xiàn)向來被競(jìng)爭(zhēng)對(duì)手和用戶詬病,因此新一代Core架構(gòu)在功耗上進(jìn)行改進(jìn)也就十分重要,并被稱為Intel Intelligent Power Capability,包括采用了先進(jìn)的65nm Strained Silicon應(yīng)變硅技術(shù)、Low-K介質(zhì)等技術(shù),還對(duì)各個(gè)運(yùn)算部件都單獨(dú)加入了電源控制功能,僅在需要的時(shí)候才開啟相應(yīng)工作電路。先進(jìn)的能源管理技術(shù)讓Core架構(gòu)的處理器的功耗表現(xiàn)很出色,這也是Conroe處理器迅速被用戶接受的一個(gè)重要因素。◆ Intel Core2處理器技術(shù)一覽 EIST、ClE、TM2、VT、XDEIST技術(shù) EIST全稱為Enhanced Intel SpeedStep Technology,是Intel專門為移動(dòng)平臺(tái)和服務(wù)器平臺(tái)處理器開發(fā)的一種節(jié)電技術(shù),它能夠根據(jù)不同的系統(tǒng)工作量自動(dòng)調(diào)節(jié)處理器的電壓和頻率,以減少耗電量和發(fā)熱量。到后來,從Pentium 4 6xx系列開始Intel把這項(xiàng)技術(shù)也移植到桌面處理器上。
ClE技術(shù) ClE全稱為C1E enhanced halt stat,它首次出現(xiàn)是在Pentium4 5xxJ系列處理器上,取代了以前的Pentium 4處理器和其它大部分x86處理器中的所常用的C1 halt state。C1 halt state由操作系統(tǒng)idel進(jìn)行發(fā)出的HLT命令觸發(fā),然后處理器就會(huì)進(jìn)入到低功耗的掛起狀態(tài)(halt state)。最新的C1E halt state也是由HLT命令觸發(fā)的,它是通過調(diào)節(jié)倍頻來逐級(jí)的降低處理器的主頻,同時(shí)還可以降低電壓。?C1E與EIST的不同 EIST的觸發(fā)機(jī)制同C1E halt state是不同的,它的運(yùn)作需要BIOS和操作系統(tǒng)的支持(Windows XP SP2/Windows Server 2003 SP1/Linux 2.6 kernel 或更新的版本 ),由操作系統(tǒng)通過ACPI進(jìn)行調(diào)節(jié)。簡(jiǎn)而言之,EIST能更有智慧地來管理處理器資源,可以根據(jù)必需的處理器負(fù)載程度與系統(tǒng)速度來自動(dòng)調(diào)整處理器的電壓與核心頻率,而且調(diào)節(jié)的級(jí)別更加的細(xì)致,因此相比C1E halt可以更加精確的調(diào)節(jié)處理器的狀態(tài)。Thermal Monitor2(TM2) TM2全稱Thermal Monitor2,是Intel在LGA775封裝的Prescott核心處理器中增加的新的過熱保護(hù)機(jī)制。類似于Pentium4處理器中的溫度回饋裝置TM1(Thermal Monitor1),當(dāng)處理器過熱時(shí),Pentium4處理器的主頻會(huì)降低一半,此時(shí)功耗也會(huì)降低一半,從而降低處理器溫度達(dá)到保護(hù)處理器安全的目的。與TM1相比,TM2可以提供更智能,更有效的處理器熱量功耗的管理方式,在保證處理器基本性能的前提下盡可能在滿負(fù)荷情況下降低處理器的功耗和溫度。 TM2的主要工作方式仍然是通過TCC進(jìn)行處理器主頻的控制,不過它被稱為“Enhanced TCC(增強(qiáng)型TCC)”,通過調(diào)節(jié)處理器的倍頻和輸入電壓來降低處理器的功耗。 TM2為處理器的工作狀態(tài)預(yù)設(shè)了兩個(gè)點(diǎn):第一點(diǎn)的工作狀態(tài)是正常的主頻和核心電壓;第二點(diǎn)是低主頻和低電壓點(diǎn)。一旦TM2偵測(cè)到處理器的溫度上升到預(yù)設(shè)的警戒溫度時(shí),E-TCC電路被激活,調(diào)整處理器的第一點(diǎn)主頻和電壓,朝著第二點(diǎn)的預(yù)設(shè)值轉(zhuǎn)換。這一轉(zhuǎn)換的過程非常快――僅5微妙。在轉(zhuǎn)換的這段時(shí)間之內(nèi),處理器不能響應(yīng)系統(tǒng)總線的訪問請(qǐng)求的。 處理器的主頻降到預(yù)設(shè)的低值之后,便會(huì)向主板上的電壓控制模塊發(fā)出新的電壓識(shí)別信號(hào)(VID Code)。因此,要實(shí)現(xiàn)TM2,主板的電壓控制模塊必須支持處理器的多電壓轉(zhuǎn)換過程,具備較低的電壓輸出能力。在處理器電壓轉(zhuǎn)換的過程中,可以接受系統(tǒng)總線對(duì)其的訪問,執(zhí)行指令。 處理器溫度下降到正常值時(shí),處理器的工作主頻和電壓便會(huì)朝正常的值上升。首先上升的是電壓,這樣可以保證處理器恢復(fù)到正常頻率工作后的穩(wěn)定性(因?yàn)榈蛪焊哳l一般會(huì)導(dǎo)致處理器工作不穩(wěn),就像加壓超頻的原理)。