尤物精品在线,国产精品嫩草99a,国产精品成人一区二区网站软件

我解百度之星題目之" 百度語(yǔ)言翻譯機(jī) "

/*1.百度語(yǔ)言翻譯機(jī)
百度的工程師們是非常注重效率的，在長(zhǎng)期的開(kāi)發(fā)與測(cè)試過(guò)程中，他們逐漸創(chuàng)造了一套獨(dú)特的縮略語(yǔ)。他們?cè)谄綍r(shí)的交談、會(huì)議，甚至在各種技術(shù)文檔中都會(huì)大量運(yùn)用。

為了讓新員工可以更快地適應(yīng)百度的文化，更好地閱讀公司的技術(shù)文檔，人力資源部決定開(kāi)發(fā)一套專用的翻譯系統(tǒng)，把相關(guān)文檔中的縮略語(yǔ)和專有名詞翻譯成日常語(yǔ)言。

輸入要求：
輸入數(shù)據(jù)包含三部分：
1. 第一行包含一個(gè)整數(shù)N(N<=10000)，表示總共有多少個(gè)縮略語(yǔ)的詞條；
2. 緊接著有N行的輸入，每行包含兩個(gè)字符串，以空格隔開(kāi)。第一個(gè)字符串為縮略語(yǔ)（僅包含大寫(xiě)英文字符，長(zhǎng)度不超過(guò)10字節(jié)），第二個(gè)字符串為日常語(yǔ)言（不包含空格，長(zhǎng)度不超過(guò)255字節(jié)）；
3. 從第N+2開(kāi)始到輸入結(jié)束為包含縮略語(yǔ)的相關(guān)文檔（總長(zhǎng)度不超過(guò)1000000個(gè)字節(jié)）。例：
6
PS 門(mén)戶搜索部
NLP 自然語(yǔ)言處理
PM 產(chǎn)品市場(chǎng)部
HR 人力資源部
PMD 產(chǎn)品推廣部
MD 市場(chǎng)發(fā)展部
百度的部門(mén)包括PS，PM，HR，PMD，MD等等，其中PS還包括NLP小組。

輸出要求：
輸出將縮略語(yǔ)轉(zhuǎn)換成日常語(yǔ)言后的文檔。（將縮略語(yǔ)轉(zhuǎn)換成日常語(yǔ)言，其他字符保留原樣）。例：
百度的部門(mén)包括門(mén)戶搜索部，產(chǎn)品市場(chǎng)部，人力資源部，產(chǎn)品推廣部，市場(chǎng)發(fā)展部等等，其中門(mén)戶搜索部還包括自然語(yǔ)言處理小組。

評(píng)分規(guī)則：
1．程序?qū)⑦\(yùn)行在一臺(tái)Linux機(jī)器上（內(nèi)存使用不作嚴(yán)格限制），在每一測(cè)試用例上運(yùn)行不能超過(guò)10秒，否則該用例不得分；
2．要求程序能按照輸入樣例的格式讀取數(shù)據(jù)文件，按照輸出樣例的格式將運(yùn)行結(jié)果輸出到標(biāo)準(zhǔn)輸出上。如果不能正確讀入數(shù)據(jù)和輸出數(shù)據(jù)，該題將不得分；
3．該題目共有4個(gè)測(cè)試用例，每個(gè)測(cè)試用例為一個(gè)輸入文件。各測(cè)試用例占該題目分?jǐn)?shù)的比例分別為25%，25%，25%，25%；
4．該題目20分。

注意事項(xiàng)：
1．輸入數(shù)據(jù)是中英文混合的，中文采用GBK編碼。
GBK：是又一個(gè)漢字編碼標(biāo)準(zhǔn)，全稱《漢字內(nèi)碼擴(kuò)展規(guī)范》。采用雙字節(jié)表示，總體編碼范圍為 8140-FEFE，首字節(jié)在 81-FE 之間，尾字節(jié)在 40-FE 之間，排除xx7F。總計(jì) 23940 個(gè)碼位，共收入 21886 個(gè)漢字和圖形符號(hào)，其中漢字（包括部首和構(gòu)件）21003 個(gè)，圖形符號(hào) 883 個(gè)。

2．為保證答案的唯一性，縮略語(yǔ)的轉(zhuǎn)換采用正向最大匹配（從左到右為正方向）原則。請(qǐng)注意樣例中PMD的翻譯。

/*
? Name:
? Copyright:
? Author:
? Date: 27-05-06 15:37
? Description:
*/
/*
算法介紹：
1。創(chuàng)建一個(gè)language結(jié)構(gòu)，它包含兩個(gè)字符串，分別用來(lái)存儲(chǔ)大寫(xiě)字母串和對(duì)應(yīng)的中文。
2。讀入數(shù)據(jù)N，大寫(xiě)字母串和對(duì)應(yīng)的中文（存儲(chǔ)到*lan），包含縮略語(yǔ)的相關(guān)文檔（存儲(chǔ)到textBefore[lenText]）。
3。遍歷textBefore[lenText]，將轉(zhuǎn)換成日常語(yǔ)言后的文檔存儲(chǔ)到textAfter[lenText]，轉(zhuǎn)換的格式為：
????? 如果是漢字則不轉(zhuǎn)換，直接寫(xiě)入textAfter[lenText]；
????? 如果為大寫(xiě)字母，則將其提取，存儲(chǔ)到eng[lenEng]，遍歷lan，尋找與eng[lenEng]匹配的English[lenEng]，將對(duì)應(yīng)的Chinese[lenChi]存儲(chǔ)到chi[lenChi]；然后把chi[lenChi]接到textAfter[lenText]。
4。輸出textAfter[lenText]。
*/
#include <iostream>
#include<string>
#include<fstream>
#include <time.h>

using namespace std;

const int lenEng = 11;
const int lenChi = 256;
const long lenText = 100001;

typedef struct{
????? char English[lenEng];
????? char Chinese[lenChi];
} language;

language * Readata(const char *filename, char text[], language *lan, int & N);
bool IsUpper(char ch);
void PiPei(const language *lan, int len, const char *eng, char *chi);
void Transducer(const language *lan, int len, const char *textBefore);

int main()
{
?time_t startTime;
?time_t endTime;
?time(&startTime);

????? language *lan;
????? char textBefore[lenText];
????? int N = 0;
?lan = Readata("in1.txt", textBefore, lan, N);

????? for (int i=0; i<N; i++)
??????????? cout << lan[i].English << ' ' << lan[i].Chinese << endl;
????? cout << textBefore << endl;

????? Transducer(lan, N, textBefore);

?time(&endTime);
//?cout << difftime(endTime, startTime) << endl;

?getchar();
?return 0;
}

void Transducer(const language *lan, int len, const char *textBefore)
{
????? char textAfter[lenText];
????? int topA = 0;
????? int topB = 0;
?????
????? while(textBefore[topB])
????? {
??????????? while (textBefore[topB] && !IsUpper(textBefore[topB]))
??????????? {
????????????????? textAfter[topA++] = textBefore[topB++];
??????????? }
??????????? textAfter[topA++] = '\0';

??????????? char eng[lenEng];
??????????? int topE = 0;
??????????? while (textBefore[topB] && IsUpper(textBefore[topB]))
??????????? {
????????????????? eng[topE++] = textBefore[topB++];
??????????? }
??????????? eng[topE++] = '\0';
??????????? if (textBefore[topB])
??????????? {
????????????????? char chi[lenChi];
????????????????? PiPei(lan, len, eng, chi);

????????????????? strcat(textAfter, chi);
????????????????? while(textAfter[topA])
??????????????????????? topA++;
??????????? }
????? }
????? cout << textAfter;
}

void PiPei(const language *lan, int len, const char *eng, char *chi)
{
????? for (int i=0; i<len; i++)
????? {
??????????? if (strcmp(eng, lan[i].English) == 0)
??????????? {
???????????????? strcpy(chi, lan[i].Chinese);
???????????????? return ;
??????????? }
????? }
}
bool IsUpper(char ch)
{
????? if (ch >= 'A' && ch <= 'Z')
??????????? return true;
????? return false;
}

language * Readata(const char *filename, char text[], language *lan, int & N)
{
????? fstream in(filename);
????? if (!in)
??????????? return 0;?? //結(jié)束程序執(zhí)行

????? in >> N;

????? lan = new language[N];
????? int top = 0;
????? int n = 0;
????? while (!in.eof() && n < N)
????? {
??????????? in >> lan[top].English;
??????????? in >> lan[top].Chinese;
??????????? top++;
??????????? n++;
????? }

????? char buf[lenText];
????? while (!in.eof())
????? {
??????????? in >> buf;
??????????? strcat(text, buf);
????? }

????? in.close(); //關(guān)閉文件

????? return lan;
}

posted @ 2006-05-30 13:52 夢(mèng)想飛揚(yáng) 閱讀(987) | 評(píng)論 (4) | 編輯收藏

也趕一回潮流

總算有了自己的博客，以后有什么感想啊，心得啊，就往上面寫(xiě)．
最近想找一份新的工作，現(xiàn)在的工作環(huán)境真的太令人郁悶了，感覺(jué)沒(méi)一點(diǎn)上升的空間，我可不想就此一生啊！

posted @ 2006-05-13 11:28 夢(mèng)想飛揚(yáng) 閱讀(162) | 評(píng)論 (0) | 編輯收藏

僅列出標(biāo)題

goal00001111

我解百度之星題目之" 百度語(yǔ)言翻譯機(jī) "

也趕一回潮流

常用鏈接

留言簿(7)

隨筆檔案

文章檔案

相冊(cè)

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜