我們經(jīng)常會發(fā)現(xiàn)有兩種內(nèi)存轉(zhuǎn)儲(core dump)
一種是段故障(segment fault)通常是在一個非法的地址上進(jìn)行取值賦值操作造成。
一種是總線錯誤(bus error)通常是指針強(qiáng)制轉(zhuǎn)換,導(dǎo)致CPU讀取數(shù)據(jù)違反了一定的總線規(guī)則。
首先,core就是內(nèi)存的意思,在半導(dǎo)體應(yīng)用之前,內(nèi)存是由鐵氧化物圓環(huán)制造的(core),但一直沿用至今。
而這兩種錯誤,都是有硬件告知操作系統(tǒng)一個有問題的內(nèi)存引用。操作系統(tǒng)通過信號,再將錯誤信息告知進(jìn)程。缺省情況下,進(jìn)程收到“總線錯誤”或“段錯誤”信號后,將信息轉(zhuǎn)儲并終止。當(dāng)然也可以為這些信號設(shè)置一個信號處理程序(signal handler)。
總線錯誤(bus error),幾乎都是有內(nèi)存未對齊讀引起的。內(nèi)存對齊,就是內(nèi)存變量的地址只能是其大小的整數(shù)倍,這樣存儲的目的就是為了方便并快速存取內(nèi)存。一般情況下,編譯器都會做好內(nèi)存對齊工作,為什么又會引發(fā)段故障呢?很多情況就是由指針和強(qiáng)制類型轉(zhuǎn)換引起的,如:
union{
char a[10];
int i;
}u;
int *p = (int *)&(u.a[1]);
*p = 17;
當(dāng)然,還有一些其它原因會引起“總線錯誤”,如奇偶校驗(yàn)碼錯誤,所引用的內(nèi)存塊不存在。但是現(xiàn)在,內(nèi)存都有硬件電路檢測和修正,一般不會再傳到軟件層了;除了驅(qū)動程序,一般也不會引用不存在的內(nèi)存塊。
段錯誤,一般是由于引用不位于自己的地址空間的地址引起的。最常見的就是通過一個未初始化,或者有非法值的指針引起的,如:int *p = 0; *p = 7; 而導(dǎo)致指針的非法值可能是由于不同的編程錯誤引起的,比起“總線錯誤”更加間接。
段錯誤一般是由硬件段表轉(zhuǎn)換機(jī)構(gòu)的錯誤引發(fā),如Sun硬件中的內(nèi)存管理單元(MMU)。
還有一個微妙之處是,如果未初始化的指針恰好具有未對齊的值,它將產(chǎn)生總線錯誤,而不是段錯誤。