數(shù)組與指針,究竟有什么關(guān)聯(lián)?什么情況下等同,什么時(shí)候不等同? 老問題,新收獲
前兩天看《C專家編程》,結(jié)果硬是卡在數(shù)組與指針這塊好久,原本以為自己已經(jīng)掌握的東西,原來還是沒有掌握精髓
拋出兩個(gè)問題,然后我們?cè)诮鉀Q這兩個(gè)問題的過程中review指針與數(shù)組:
問題一:
char arr[] = "abcdefg";
char *ptr = "abcdefg";
我們知道,arr[i]與ptr[i]都是正確的,但兩者又有什么根本的差異呢?如果是char (*pa)[10]與char **pp,那么pa[1][2]與pp[1][2]有什么區(qū)別呢?
問題二:
qsort在針對(duì)指針數(shù)組與二維數(shù)組排序時(shí)的區(qū)別?
----------------------------------------------------------------------------------------------------------
問題一:
首先,要明確一點(diǎn),編譯器為每個(gè)標(biāo)識(shí)符分配一個(gè)地址,這個(gè)地址在編譯階段可知,相反,存儲(chǔ)在標(biāo)識(shí)符中的值只有在運(yùn)行時(shí)才可知
對(duì)于數(shù)組,有 &arr = arr = &(arr[0])
對(duì)于指針,有 &ptr != ptr = &(ptr[0])
對(duì)于編譯器,它所知道的是&arr與&ptr,這兩個(gè)標(biāo)識(shí)符的地址
基于上述三條(前兩條,寫個(gè)簡單的程序即可測(cè)試),即可得出結(jié)論: 雖然arr[i]與ptr[i]都能正確訪問某個(gè)字符(事實(shí)上,都會(huì)被編譯器改寫成*(arr+i)或者*(ptr+i)的形式),但是兩者生成的匯編代碼是不同的
驗(yàn)證:
C語言代碼:
char arr[] = "abcdefg";
char *ptr = "abcdefg";
void
difference()
{
char a = arr[3];
char b = ptr[3];
}
匯編代碼(gcc -S test.c)
difference:
pushl %ebp
movl %esp, %ebp
subl $16, %esp
/* char a = arr[3] */
movzbl arr+3, %eax /* 取地址(arr+3)處的值,放入寄存器 */
movb %al, -1(%ebp)
/* char b = ptr[3] */
movl ptr, %eax /* 取ptr的值(Mem[ptr]),放入寄存器 */
addl $3, %eax
movzbl (%eax), %eax /* 將寄存器%eax的值作為地址,取該地址的值放入寄存器 */
movb %al, -2(%ebp)
leave
ret
略微對(duì)上述匯編代碼進(jìn)行了注釋,可以發(fā)現(xiàn)兩者的差異,指針跟數(shù)組相比,前者多了“一層間接引用”
(Note: 匯編尋址,例如,$Imm是立即數(shù),Imm是絕對(duì)尋址(=Mem[Imm]),Ea是寄存器尋址,(Ea)則是間接尋址(=Mem[Register[Ea]]);可參考《深入理解計(jì)算機(jī)系統(tǒng)》第3章)
如果是char (*pa)[10]與char **pp,pa是指向數(shù)組的指針,而pp是指向指針的指針,這里有點(diǎn)類似于之前的討論
需要明白的就是: pa是指向數(shù)組的指針,保存的就是數(shù)組的地址;數(shù)組的地址等于數(shù)組首元素的地址;pa[i]等同于一元數(shù)組名稱,就是指向數(shù)組首元素的指針,也保存的是數(shù)組首元素的地址,因此有: pa+i(指向數(shù)組的指針) = pa[i] = &(pa[i][0])
表達(dá)式pa[1][2]與pp[1][2]所產(chǎn)生的匯編代碼也是不同的
(Note: 指向數(shù)組的指針p與數(shù)組名a(指向數(shù)組首元素的指針),兩者的值相同,但含義不一樣,例如p+1與a+1就完全不同)
驗(yàn)證:
C語言代碼:
void
array_print(char (*pa)[10])
{
char c = pa[1][2];
}
void
pointer_print(char **pp)
{
char c = pp[1][2];
}
匯編代碼:
array_print:
pushl %ebp
movl %esp, %ebp
subl $16, %esp
movl 8(%ebp), %eax /* 將pa的值(Mem[pa])放入寄存器 */
addl $10, %eax
movzbl 2(%eax), %eax
movb %al, -1(%ebp)
leave
ret
pointer_print:
pushl %ebp
movl %esp, %ebp
subl $16, %esp
movl 8(%ebp), %eax /* 將pp的值放入寄存器 */ addl $4, %eax
movl (%eax), %eax
addl $2, %eax
movzbl (%eax), %eax
movb %al, -1(%ebp)
leave
ret
問題二:
有了前面的講解,這里直接上代碼
#include "basic.h"
char *strings[] = { "zhao",
"pan",
"anan",
NULL };
char arr[][5] = { "zhao",
"pan",
"anan" };
void
test_a2_addr()
{
printf("Addr Testing\n");
printf("addr(arr+1): %p\n", arr+1);
printf("addr(arr[1]): %p\n", arr[1]);
printf("addr(arr[1][0]): %p\n", &arr[1][0]);
}
int
compare_pp(const void *arg1, const void *arg2)
{
return strcmp(*(char **)arg1, *(char **)arg2);
}
int
compare_a2(const void *arg1, const void *arg2)
{
return strcmp(*(char (*)[5])arg1, *(char (*)[5])arg2);
//return strcmp((char *)arg1, (char *)arg2); //ok,too
}
void
test_pp()
{
qsort(strings, 3, sizeof(char *), compare_pp);
printf("\nResult of qsort for POINTER-ARRAY\n");
char **s = strings;
while(*s != NULL) {
printf("%s\n", *s);
++s;
}
}
void
test_a2()
{
qsort(arr, 3, sizeof(char)*5, compare_a2);
printf("\nResult of qsort for TWO-ARRAY\n");
int i;
for(i=0; i<3; ++i)
printf("%s\n", arr[i]);
}
int
main(int argc, char **argv)
{
test_a2_addr();
test_pp();
test_a2();
}