由于我們的前臺使用C語言編寫CGI,如果對方提供XML接口給我們傳遞數(shù)據(jù),就必須有解析的程序,這也可能是今后數(shù)據(jù)接口的最通用的辦法。經(jīng)過研究,正如使用C語言來生成頁面一樣,顯然使用C語言解析XML要比PHP和ASP要麻煩很多。
同其它語言一樣,解析的方法一般都是調(diào)用現(xiàn)有的解析器,因?yàn)檫@樣省時(shí)省力。PHP4是內(nèi)置的EXPAT,PHP5是內(nèi)置的LIBXML2,WIN平臺可以調(diào)用MSXML。FREEBSD上使用C語言,最流行的就是調(diào)用EXPAT和LIBXML2,由于PHP基于某些原因放棄了EXPAT,所以我主要試用了LIBXML2。
LIBXML2主頁是
http://xmlsoft.org安裝過程:(需要ROOT權(quán)限)
gunzip -c libxml2-2.6.22.tar.gz | tar xvf -
cd libxml2-2.6.22
./configure
make
su
make install
exit
安裝完成后就可以使用簡單的代碼解析XML文件,包括本地和遠(yuǎn)程的文件,但是在編碼上有一些問題。LIBXML默認(rèn)只支持UTF-8的編碼,無論輸入輸出都是UTF-8,所以如果你解析完一個(gè)XML得到的結(jié)果都是UTF-8的,如果需要輸出GB2312或者其它編碼,需要ICONV來做轉(zhuǎn)碼(生成UTF-8編碼的文件也可以用它做)。
ICONV的安裝過程和LIBXML2一樣。
下面是一些例子,包括解析XML和轉(zhuǎn)碼
# i nclude <stdio.h>
# i nclude <string.h>
# i nclude <stdlib.h>
# i nclude <libxml/xmlmemory.h>
# i nclude <libxml/parser.h>

#i nclude <iconv.h>

//***********************************************************************//
//* d_ConvertCharset: 編碼轉(zhuǎn)換函數(shù),可以轉(zhuǎn)換任意兩種編碼格式
//* ddr/2005-11-10
//* 此函數(shù)需要庫libiconv,編譯時(shí)需加-liconv,如果找不到庫,編譯時(shí)加-L/usr/local/lib
// 其中/usr/local/lib為安裝庫文件的目錄
// 使用時(shí)需要#i nclude <iconv.h>,如果找不到此頭文件請?jiān)诰幾g時(shí)加-I/usr/local/include
// 其中/usr/local/include為安裝頭文件的目錄
//* 需要使用static變量作為輸出的緩沖區(qū),這里設(shè)置的最大長度是1024,可以根據(jù)需要修改,以避免溢出
// 由于使用了static變量,所以這個(gè)函數(shù)是不可重入的,非線程安全的
// 可以改用new的方式來實(shí)現(xiàn)可重入
//***********************************************************************//
static char s_strBufOut[1024];
char *d_ConvertCharset(char *cpEncodeFrom, char *cpEncodeTo, const char *cpInput)


{

char *cpOut;
size_t iInputLen, iOutLen, iReturn;

iconv_t c_pt;
if ((c_pt = iconv_open(cpEncodeTo, cpEncodeFrom)) == (iconv_t)-1)

{
printf("iconv_open failed!\n");
return NULL;
}
iconv(c_pt, NULL, NULL, NULL, NULL);

iInputLen = strlen(cpInput) + 1;
iOutLen = 1024;
cpOut = s_strBufOut;
iReturn = iconv(c_pt, &cpInput, &iInputLen, &cpOut, &iOutLen);

if (iReturn == -1)

{
return NULL;
}
iconv_close(c_pt);
return s_strBufOut;
}

//輸出每一項(xiàng)的內(nèi)容,使用GB2312編碼輸出
void parseItem (xmlDocPtr doc, xmlNodePtr cur)


{
xmlChar *key;
cur = cur->xmlChildrenNode;
while (cur != NULL)

{
if ((!xmlStrcmp(cur->name, (const xmlChar *)"songname")))

{
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("songname: %s\n", d_ConvertCharset("utf-8", "gb2312", (char *)key));
xmlFree(key);
}
else if ((!xmlStrcmp(cur->name, (const xmlChar *)"songurl")))

{
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("songurl: %s\n", d_ConvertCharset("utf-8", "gb2312", (char *)key));
xmlFree(key);
}
else if ((!xmlStrcmp(cur->name, (const xmlChar *)"singer")))

{
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("singer: %s\n", d_ConvertCharset("utf-8", "gb2312", (char *)key));
xmlFree(key);
}
else if ((!xmlStrcmp(cur->name, (const xmlChar *)"singerurl")))

{
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("singerurl: %s\n", d_ConvertCharset("utf-8", "gb2312", (char *)key));
xmlFree(key);
}
cur = cur->next;
}
return;
}

void parseDoc(char *docname)


{

xmlDocPtr doc; //解析樹
xmlNodePtr cur; //當(dāng)前節(jié)點(diǎn)
doc = xmlParseFile(docname);
if (doc == NULL )

{
fprintf(stderr,"Document not parsed successfully. \n");
return;
}
//得到根節(jié)點(diǎn)
cur = xmlDocGetRootElement(doc);
if (cur == NULL)

{
fprintf(stderr,"empty document\n");
xmlFreeDoc(doc);
return;
}
//判斷根節(jié)點(diǎn)是不是mp3
if (xmlStrcmp(cur->name, (const xmlChar *) "mp3"))

{
fprintf(stderr,"document of the wrong type, root node != mp3");
xmlFreeDoc(doc);
return;
}
//得到當(dāng)前節(jié)點(diǎn)的第一個(gè)子節(jié)點(diǎn),即第一個(gè)ITEM
cur = cur->xmlChildrenNode;
while (cur != NULL)

{
if ((!xmlStrcmp(cur->name, (const xmlChar *)"item")))

{
//輸出每個(gè)ITEM
parseItem (doc, cur);
}
cur = cur->next;
}
xmlFreeDoc(doc);
return;
}

//入?yún)⒖梢允且粋€(gè)文件,也可以是一個(gè)URL,要求必須是UTF-8編碼
int main(int argc, char **argv)


{
char *docname;
if (argc <= 1)

{
printf("Usage: %s docname\n", argv[0]);
return(0);
}

docname = argv[1];
parseDoc (docname);

return 0;
}