由于我們的前臺使用C語言編寫CGI,如果對方提供XML接口給我們傳遞數據,就必須有解析的程序,這也可能是今后數據接口的最通用的辦法。經過研究,正如使用C語言來生成頁面一樣,顯然使用C語言解析XML要比PHP和ASP要麻煩很多。
同其它語言一樣,解析的方法一般都是調用現有的解析器,因為這樣省時省力。PHP4是內置的EXPAT,PHP5是內置的LIBXML2,WIN平臺可以調用MSXML。FREEBSD上使用C語言,最流行的就是調用EXPAT和LIBXML2,由于PHP基于某些原因放棄了EXPAT,所以我主要試用了LIBXML2。
LIBXML2主頁是
http://xmlsoft.org安裝過程:(需要ROOT權限)
gunzip -c libxml2-2.6.22.tar.gz | tar xvf -
cd libxml2-2.6.22
./configure
make
su
make install
exit
安裝完成后就可以使用簡單的代碼解析XML文件,包括本地和遠程的文件,但是在編碼上有一些問題。LIBXML默認只支持UTF-8的編碼,無論輸入輸出都是UTF-8,所以如果你解析完一個XML得到的結果都是UTF-8的,如果需要輸出GB2312或者其它編碼,需要ICONV來做轉碼(生成UTF-8編碼的文件也可以用它做)。
ICONV的安裝過程和LIBXML2一樣。
下面是一些例子,包括解析XML和轉碼
# i nclude <stdio.h>
# i nclude <string.h>
# i nclude <stdlib.h>
# i nclude <libxml/xmlmemory.h>
# i nclude <libxml/parser.h>

#i nclude <iconv.h>

//***********************************************************************//
//* d_ConvertCharset: 編碼轉換函數,可以轉換任意兩種編碼格式
//* ddr/2005-11-10
//* 此函數需要庫libiconv,編譯時需加-liconv,如果找不到庫,編譯時加-L/usr/local/lib
// 其中/usr/local/lib為安裝庫文件的目錄
// 使用時需要#i nclude <iconv.h>,如果找不到此頭文件請在編譯時加-I/usr/local/include
// 其中/usr/local/include為安裝頭文件的目錄
//* 需要使用static變量作為輸出的緩沖區,這里設置的最大長度是1024,可以根據需要修改,以避免溢出
// 由于使用了static變量,所以這個函數是不可重入的,非線程安全的
// 可以改用new的方式來實現可重入
//***********************************************************************//
static char s_strBufOut[1024];
char *d_ConvertCharset(char *cpEncodeFrom, char *cpEncodeTo, const char *cpInput)


{

char *cpOut;
size_t iInputLen, iOutLen, iReturn;

iconv_t c_pt;
if ((c_pt = iconv_open(cpEncodeTo, cpEncodeFrom)) == (iconv_t)-1)

{
printf("iconv_open failed!\n");
return NULL;
}
iconv(c_pt, NULL, NULL, NULL, NULL);

iInputLen = strlen(cpInput) + 1;
iOutLen = 1024;
cpOut = s_strBufOut;
iReturn = iconv(c_pt, &cpInput, &iInputLen, &cpOut, &iOutLen);

if (iReturn == -1)

{
return NULL;
}
iconv_close(c_pt);
return s_strBufOut;
}

//輸出每一項的內容,使用GB2312編碼輸出
void parseItem (xmlDocPtr doc, xmlNodePtr cur)


{
xmlChar *key;
cur = cur->xmlChildrenNode;
while (cur != NULL)

{
if ((!xmlStrcmp(cur->name, (const xmlChar *)"songname")))

{
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("songname: %s\n", d_ConvertCharset("utf-8", "gb2312", (char *)key));
xmlFree(key);
}
else if ((!xmlStrcmp(cur->name, (const xmlChar *)"songurl")))

{
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("songurl: %s\n", d_ConvertCharset("utf-8", "gb2312", (char *)key));
xmlFree(key);
}
else if ((!xmlStrcmp(cur->name, (const xmlChar *)"singer")))

{
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("singer: %s\n", d_ConvertCharset("utf-8", "gb2312", (char *)key));
xmlFree(key);
}
else if ((!xmlStrcmp(cur->name, (const xmlChar *)"singerurl")))

{
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("singerurl: %s\n", d_ConvertCharset("utf-8", "gb2312", (char *)key));
xmlFree(key);
}
cur = cur->next;
}
return;
}

void parseDoc(char *docname)


{

xmlDocPtr doc; //解析樹
xmlNodePtr cur; //當前節點
doc = xmlParseFile(docname);
if (doc == NULL )

{
fprintf(stderr,"Document not parsed successfully. \n");
return;
}
//得到根節點
cur = xmlDocGetRootElement(doc);
if (cur == NULL)

{
fprintf(stderr,"empty document\n");
xmlFreeDoc(doc);
return;
}
//判斷根節點是不是mp3
if (xmlStrcmp(cur->name, (const xmlChar *) "mp3"))

{
fprintf(stderr,"document of the wrong type, root node != mp3");
xmlFreeDoc(doc);
return;
}
//得到當前節點的第一個子節點,即第一個ITEM
cur = cur->xmlChildrenNode;
while (cur != NULL)

{
if ((!xmlStrcmp(cur->name, (const xmlChar *)"item")))

{
//輸出每個ITEM
parseItem (doc, cur);
}
cur = cur->next;
}
xmlFreeDoc(doc);
return;
}

//入參可以是一個文件,也可以是一個URL,要求必須是UTF-8編碼
int main(int argc, char **argv)


{
char *docname;
if (argc <= 1)

{
printf("Usage: %s docname\n", argv[0]);
return(0);
}

docname = argv[1];
parseDoc (docname);

return 0;
}