我們經常會發現有兩種內存轉儲(core dump)
一種是段故障(segment fault)通常是在一個非法的地址上進行取值賦值操作造成。
一種是總線錯誤(bus error)通常是指針強制轉換,導致CPU讀取數據違反了一定的總線規則。
首先,core就是內存的意思,在半導體應用之前,內存是由鐵氧化物圓環制造的(core),但一直沿用至今。
而這兩種錯誤,都是有硬件告知操作系統一個有問題的內存引用。操作系統通過信號,再將錯誤信息告知進程。缺省情況下,進程收到“總線錯誤”或“段錯誤”信號后,將信息轉儲并終止。當然也可以為這些信號設置一個信號處理程序(signal handler)。
總線錯誤(bus error),幾乎都是有內存未對齊讀引起的。內存對齊,就是內存變量的地址只能是其大小的整數倍,這樣存儲的目的就是為了方便并快速存取內存。一般情況下,編譯器都會做好內存對齊工作,為什么又會引發段故障呢?很多情況就是由指針和強制類型轉換引起的,如:
union{
char a[10];
int i;
}u;
int *p = (int *)&(u.a[1]);
*p = 17;
當然,還有一些其它原因會引起“總線錯誤”,如奇偶校驗碼錯誤,所引用的內存塊不存在。但是現在,內存都有硬件電路檢測和修正,一般不會再傳到軟件層了;除了驅動程序,一般也不會引用不存在的內存塊。
段錯誤,一般是由于引用不位于自己的地址空間的地址引起的。最常見的就是通過一個未初始化,或者有非法值的指針引起的,如:int *p = 0; *p = 7; 而導致指針的非法值可能是由于不同的編程錯誤引起的,比起“總線錯誤”更加間接。
段錯誤一般是由硬件段表轉換機構的錯誤引發,如Sun硬件中的內存管理單元(MMU)。
還有一個微妙之處是,如果未初始化的指針恰好具有未對齊的值,它將產生總線錯誤,而不是段錯誤。