朋友的家人做生意,每日從各地分店處收集報(bào)表,然后回去匯總。由于不想用那種復(fù)雜的管理軟件,就叫他寫一個(gè)小工具。于是他找到了我,讓我想想辦法。
Python是個(gè)令人驚奇的工具,而不僅僅是一種語言。對(duì)比老牌的Perl,看似Python不是那么的精通 —— 對(duì)比Perl超快的文本處理速度和廣泛應(yīng)用于Cgi程序的編寫歷史,以及目前大紅大紫的Ruby在Web開發(fā)上的病毒式蔓延,而比起靜態(tài)語言比如C\C++,虛擬機(jī)Java和C#來說,速度又成了問題。但是Python的實(shí)力可不容小視,NASA都用Python可不是吹的,況且,Python的學(xué)習(xí)難度比Perl小多了,剛學(xué)時(shí)讓我找到了以前QBASIC的感覺。
此程序具體要求如下:每日產(chǎn)生副表若干(如副表文件)。程序先核對(duì)附表的日期和銷售點(diǎn)。如果銷售點(diǎn)不同日期相同,便把不同副表的相同產(chǎn)品號(hào)的 “銷售數(shù)量”欄相加,填入總表“銷售數(shù)量”欄。將副表的“總利潤”欄相加填入總表的“總利潤”欄。其他副表信息復(fù)制到總表(備注除外,由用戶自行處理)。表頭的樣式如下:


啊哈,很簡單的表頭。其中需要操作的是“銷售數(shù)量”和“總利潤”,也就是把相同時(shí)間的報(bào)表相加。但是這樣有個(gè)嚴(yán)重問題!
必須要求,相同報(bào)表的產(chǎn)品名稱、貨號(hào)的順序不能出錯(cuò),各地要絕對(duì)統(tǒng)一,否則全部這樣照樣拷貝就會(huì)出錯(cuò)!
讓我們分析一下思路:時(shí)間是關(guān)鍵。時(shí)間決定了哪些報(bào)表需要分門別類,生成哪一天的統(tǒng)計(jì)總表。數(shù)據(jù)結(jié)構(gòu)上,用什么呢?簡單的list?不行,我嘗試過。應(yīng)該使用map容器,把日期作為key,儲(chǔ)存的Value是個(gè)列表。程序先掃描所有的Excel文件獲取日期,然后把相同日期報(bào)表的COM文檔接口儲(chǔ)存起來,實(shí)現(xiàn)了分門別類。最后遍歷這個(gè)map容器,計(jì)算,生成每日的統(tǒng)計(jì)總表。代碼如下,經(jīng)過測試正常。
?1
import?os;
?2
import?sys;
?3
import?time;
?4
import?datetime;
?5
#請(qǐng)先安裝對(duì)應(yīng)著你自己的Python版本的PythonWin32
?6
import?win32com.client;
?7
?8
?9
mapper?=?{};
10
11
app?=?win32com.client.Dispatch("Excel.Application");
12
PipeOut?=?os.popen("dir?*.xls?/B");
13
FileList?=?PipeOut.readlines();
14
PipeOut?=?os.popen("cd");
15
CurDic?=?PipeOut.readline();
16
CurDic?=?CurDic[:-1]?+?"\\";#去處末尾的\n
17
print?"當(dāng)前工作目錄為"+CurDic;
18
19
????#讀取每個(gè)文件的時(shí)間和儲(chǔ)存相應(yīng)的COM接口
20
21
for?filename?in?FileList:
22
????filename?=?CurDic+filename[:-1];
23
????print?filename;
24
????Doc?=?app.Workbooks.Open(filename);
25
????Sheet?=?Doc.Sheets(1);
26
????Time?=?Sheet.Cells(2,5);
27
????print?type(Time);
28
????TimeKey?=?str(Time);
29
????print?TimeKey;
30
????if?mapper.has_key(TimeKey):
31
????????mapper[TimeKey].append(Sheet);
32
????else?:
33
????????mapper[TimeKey]?=?[];
34
????????mapper[TimeKey].append(Sheet);
35
????#print?mapper;
36
37
38
????#生成新的統(tǒng)計(jì)總表
39
????
40
????#開始處理mapper?每次從一個(gè)自表中讀取2x20個(gè)數(shù)據(jù),然后和總表相加
41
print?"-------------------------------------";
42
Protetype?=?[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0];
43
a?=?0;
44
b?=?0;
45
c?=?0;
46
47
for?k,v?in?mapper.items():
48
????print?"//////////////////////////////////"
49
????a+=1;
50
????Count?=?[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0];
51
????Benefit?=?[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0];
52
????Name?=?[u"",u"",u"",u"",u"",u"",u"",u"",u"",u"",u"",u"",u"",u"",u"",u"",u"",u"",u"",u""];
53
????#print?Count;
54
????#print?Benefit;
55
????????#Total?=?app.Workbooks.Open(CurDic+"Template\\TotalTemplate.xls");
56
????print?"How?manu?Sheets?in?this?List???",len(v);
57
????for?sht?in?v:
58
????????b+=1;
59
????????_Count?=?sht.Range("C4:C23").Value;
60
????????_Benefit?=?sht.Range("F4:F23").Value;
61
????????_Name?=?sht.Range("B4:B23").Value;
62
????????#print?_Count;
63
????????#print?_Benefit;
64
????????assert(len(_Count)?==?len(_Benefit));
65
????????for?i?in?range(0,len(_Count)):
66
????????????c+=1;
67
????????????Count[i]?=?_Count[i][0]?+?Count[i];
68
????????????Benefit[i]?=?_Benefit[i][0]?+?Benefit[i];
69
????????????Name[i]?=?_Name[i][0];
70
????????#以上作為儲(chǔ)存總表項(xiàng)的數(shù)據(jù)
71
????Total?=?app.Workbooks.Open(CurDic+"Template\\TotalTemplate.xls");
72
????TotalSheet?=?Total.Sheets(1);
73
????_Time?=?k[:k.find("?")];
74
????_Time?=?_Time.replace("/","-");
75
????print?_Time;
76
????print?Count;
77
????print?Benefit;
78
????????#TotalSheet.Cells(2,2).Value?=?_Time;
79
????for?i?in?range(0,len(Count)):
80
????????TotalSheet.Cells(4+i,3).Value?=?Count[i];#填充數(shù)量
81
????????TotalSheet.Cells(4+i,6).Value?=?Benefit[i];#填充利潤
82
????????TotalSheet.Cells(4+i,2).Value?=?Name[i];#填充貨物名稱
83
84
????#保存總表
85
????Total.SaveAs(CurDic+_Time+"統(tǒng)計(jì)總表.xls");
86
????del?Count,Benefit;
87
print?"++++++++++++++++++++++++++++"
88
print?a,b,c;
89
app.Quit();
90
app?=?None;
91
使用方法,先安裝Python 2.4和PythonWin For 2.4。然后把這個(gè)腳本拷貝到分表的文件夾下,然后運(yùn)行(調(diào)試),自動(dòng)生成與日期相關(guān)的總表。效果圖如下:

最終解決思路的提示:其實(shí)這種方法只能在規(guī)模比較小的時(shí)候,因?yàn)檫@種脫離于總系統(tǒng)的處理效率實(shí)在非常低,而且Excel二進(jìn)制文件,空表的占用就達(dá)15k,在未來有大量業(yè)務(wù)數(shù)據(jù)處理的話將是無法忍受的噩夢(mèng)。所以,我建議這位商務(wù)人士分析一下他所使用的處理系統(tǒng),用便宜的網(wǎng)絡(luò)線路構(gòu)建從各地中心服務(wù)器系統(tǒng),使用XML作為數(shù)據(jù)交換得媒介,在自己的服務(wù)器上您只需要使用簡單的SQL處理過程就可以了,而且數(shù)據(jù)的可靠度比平面Excel文檔高得多。
數(shù)據(jù)在這里下載,為了保險(xiǎn)起見請(qǐng)不要使用中文的文件夾目錄。
posted on 2007-02-21 12:37
周波 閱讀(2658)
評(píng)論(2) 編輯 收藏 引用 所屬分類:
無庸技術(shù) 、
奇思妙想