img = image.new();
img:getURL("http://www.***.com/test.asp","*.png");
assert(img:ok(),"下載驗證碼失敗");
img:Crop(4 ,3 , 56 ,18 )
img:save("c:\\test\\test.jpg") --保存到硬盤
--折分圖片,指定一行四列
img2,img3,img4,img5 = img:split(1,4);
img2:save("c:\\test\\0001.jpg")
img3:save("c:\\test\\0002.jpg")
img4:save("c:\\test\\0003.jpg")
img5:save("c:\\test\\0004.jpg")
image.del(img);
如何確定圖片后綴名在整個驗證碼識別過程中,格式與后綴名一定不能搞錯,否則就會失敗。
通常:asp的驗證碼是bmp格式,php的驗證碼是png格式,其他驗證碼很多是jpg格式。
簡單的,在驗證碼上右鍵點選“圖片另存為”,就可以看到格式(不一定準確)。
另外,你可以用UltraEdit等以二進制方式打開看文件頭部
首先下載:
str = web.getURL("
http://www.***.com/test.asp")
string.save( str,"c:\\test.bin")
然后用UE打開test.bin看文件頭部(第一行)
jpg文件頭部有 JFIF 字眼
png文件頭部 有 PNG 字眼
gif文件頭部有 GIF字眼
如果你搞不清楚,這時候就不要指定后綴名
img:getURL("http://vwww.***.com/test.asp","")
這樣就可以下載了
二、生成驗證碼樣本數據庫
復制下面的代碼并粘貼到fap程序的「腳本區塊」內,然后點擊"回放運行",最后再點擊"讀取源代碼"。
你就可以在ApeML源代碼最后面的「數據區塊」中看到生成的驗證碼樣本了。
將「數據區塊」的內容復制需要使用驗證碼識別的fap模擬程序中覆蓋「數據區塊」即可。
local tkey =
{A=
0,B=
0,C=
0,D=
0,E=
0,F=
0,G=
0,H=
0,I=
0,J=
0,K=
0,L=
0,M=
0,N=
0,O=
0,P=
0,Q=
0,R=
0,S=
0,T=
0,U=
0,V=
0,W=
0,X=
0,Y=
0,Z=
0};
--在字典中添加所有數字鍵for i =
0,
9,
1 do tkey
[ tostring(i
) ] =
0;
end;
for k,v in pairs(tkey) do
if((#k)~=2)then
tkey[k.."A" ]=0;
tkey[k.."B" ]=0;
tkey[k.."C" ]=0;
tkey[k]=nil;
end;
end;
--k參數為鍵,v參數表示值 一個典型的tkeyle迭代器回調函數
loadtkey = function(k,v)
local img = image.new();
img:load("C:\\test\\"..k..".jpg");
assert(img:ok(),"C:\\test\\"..k..".jpg".."\n不是有效的圖片");
img:bpp(1);
img:bpp(24);
--通過上面兩句,輕松去掉驗證碼上的雜色雜點
img:Crop( 1 , 0 , 9 , 10);--修剪單個字符
img:median(2);--中值濾波進一步去雜點
tkey[k]= string.encode( img:getBytes("*.jpg") , ""); --因為轉換到字符串還是二進制,所以用base64進行編碼
image.del(img);
end;
--遍歷表tkey的所有元素,調用loadtkey加載圖片文件
for k,v in pairs(tkey) do
loadtkey(k,v);
end;
--把所有圖片保存到數據島,
ape:saveTable(tkey,"驗證碼樣本")
三、驗證碼識別
將下面的代碼添加到fap模擬程序最前面的init腳本區塊中即可
--從數據區塊讀取base64編碼的圖片數據
codekey = ape:loadTable("驗證碼樣本");
local timg = {}; --這是一個圖像數組,用來儲存還原后的驗證碼樣本的圖片數據
--必須進行一個轉換,因為codekey里面只是base64編碼的普通字符串,而timg 將是真正的圖片對象(二進制數據)
--還原到圖片對象
toImage = function(k,v)
local img = image.new();
local str = string.decode( v ,"");--首先進行base64解碼,將純文本轉換為二進制數據
img:setBytes( str ,"*.jpg");--將二進制數據還原為圖像
timg[k] = img;
end;
--載入驗證碼樣本
tkey = ape:loadTable("驗證碼樣本");
for k,v in pairs(tkey) do --驗證樣本
toImage(k,v); --轉換為圖像
end;
--轉換圖片驗證碼到字符串的函數
function ImgToString(img)
function test(imgX) --test是一個被包含在函數中的內部函數
sleep(0);
local limit = (60 * 20) + (60 * 20); --最小相似度 local關鍵字聲明為局部變量
local chr = "A"; --讀取的字符
--testimg是一個被包含在函數中的內部函數,作為table.foreach的回調函數,k參數表示鍵,v參數表示值
testimg = function(k,v)
--調用image.testXX()函數得出相似度,類似的函數還有image.testX() image.test()
local n = imgX:testXX(timg[k]);
if(n<limit)then --比較最小相似度
limit = n;
chr = k.."";
end;
end;
--遍歷timg表,并調用testimg函數
for k,v in pairs(timg) do
testimg(k,v);
end;
return string.left(chr,1); --返回讀取到的字符串首字符(如果每個字符有多個樣本)
end;
--修剪圖片
image.Crop(img, 4 ,3 , 56 ,18 )
img:bpp(1);
img:bpp(24);
--上面的過程必須與下載樣本時的代碼完全一致。
--使用split函數分割圖片
local img2,img3,img4,img5 = img:split(1,4);
win.messagePrint("正在檢測圖片,請稍候....");
return test(img2)..test(img3)..test(img4)..test(img5);
end;
需要識別驗證碼的地方添加類似下面的代碼:
img = image.new()
img:getURL("http://www.***.com/test.asp","*.jpg")
local x,y = mouse.getPos()
img:paint(x,y,60 ,20 )
local str = ImgToString(img);
code1 = string.upper( string.sub(str,1,1) );
code2 = string.upper( string.sub(str,2,2) );
code3 = string.upper( string.sub(str,3,3) );
code4 = string.upper( string.sub(str,4,4) );
key.press(100,code1,code2,code3,code4);
上面我們用了模擬按鍵的方法輸入驗證碼。
實際上大多時候可以用更簡單的方法,如下:
ele = wb:getEle("驗證碼控件名字");
ele:setAttribute("value",str)
為什么我的驗證碼與頁面上不一樣
因為我們使用img:getURL讀取驗證碼時已經刷新了驗證碼。
所以驗證碼與頁面上顯示的并不一樣,您只需要識別最新的驗證碼即可。
如何直接獲取頁面的上圖片,而不是重新下載
有些驗證碼是綁定頁面的,必須識別頁面上的驗證碼才行。
那么可以使用image.capture函數直接抓屏屏幕上的圖片即可。
請參考:image.capture函數。
更好的方法是使用ele:exec("Copy")函數直接拷貝頁面上的圖片到剪貼板。
然后使用 img:getClipBD() 獲取圖片。
請參考:ele:exec("Copy")函數 img:getClipBD()函數
四、關于剪切圖片

看上面的示意圖,Crop就是選取綠色方框內的區域去清除綠色方框外面的區域.
必須保證里面的面積正好可以平均分成四塊(假設這里是四個驗證碼字符)
這樣以后調用 img:split(1,4) 就正好分成四個字符了
分成四份的小圖片其寬度應當正好是上面的紅色小方塊的寬度。
高度與綠色方框一樣,我這里畫的參次不齊是為了讓大家看清楚。
如果你Crop的參數值不對,那么split就出錯了.
下載驗證碼圖片以后,可以使用圖像編輯軟件打開高倍放大。
五、使用種子填充算法去除驗證碼上的干擾線
模擬精靈識別驗證碼的能用是強大的,一個函數即可以去除雜色雜點。
img:bpp(1)
img:bpp(24)
經過上面兩句代碼的處理,速度很快,所有背景、干擾點、雜色蕩然無存。
但是有時候驗證碼中有大量的干擾線,并且位置隨機變動的太歷害,
這時候我們在處理驗證碼以前首先去除這些干擾線并準確的去除背景提取字符.
下面是一個模擬精靈初步處理后的驗證碼圖片.已經去除了雜色、雜點.但是上面還是有干擾線.

一個可選的辦法是用中值濾波再處理一下。img:median(2); 一個函數調用就可以,但
是這樣雖然去掉了干擾線,原來的字符也被少量的破壞了。
下面是使用種子填充算法去除干擾線的源代碼,不但能去除雜點,
而且可以去除周圍的空白(提取位置隨機變化的驗證碼),
稍加修改還能有更多的用途.
下面是自動處理以后的效果

下面是全部的源代碼:
--[[
用一個table結構{x=0; y=0}表示圖像上的「坐標點」
用一組點構成table結構表示圖像上的一條「線」。所有相連的黑色的點被認為是一條「連通線」。
找出最長的一條「連通線」,被認為是字符,其他的認為是雜點。
算法原理與種子填充算法相似。
首先讓用img:bpp函數處理為黑白圖片,并初步去除雜色。
先找到一個黑點,創建一個表示「坐標點」對象,并添加到「連通線」中。
然后在黑點周圍8個點中,再找黑色的點,找到就添加到「連通線」,這樣一直遞歸下去
直到遍歷圖像所有點,可能有幾塊。
清除雜點使用方法
image.scan(img);
清除雜點并切去掉周圍的空白
image.scan(img,true);
--]]
function image.scan(img,crop)
--用一個table數組記錄所有的「連通線」
assert(img:ok(),"image.scan 的參數必須是一個有效的圖片");
local tlines ={};
--首先計算出圖片的高度寬度,避免重復的調用
local w = img:width();
local h = img:height();
--[[以table形式定義一個數組,對應圖象中的每個點。
作用相當一個開關,首先值為false,但黑點首次被遍歷到時。把這個值變為true。
下次,再找到這個點時忽略。避免重復加入連通線。
--]]
local tchked ={};
for i=0,w,1 do
tchked[i]={};
for j=0,h,1 do
tchked[i][j]=false;
end;
end;
-----去噪
img:bpp(1);
img:bpp(24);
--首先計算出各點的顏色值,避免在循環遞歸中重復的取
local tcl={};
for i=0,w,1 do
tcl[i]={};
for j=0,h,1 do
tcl[i][j]=img:getPos(i,j);
end;
end;
--[[
算點數函數
參數x,y 坐標
參數tab 所屬連通線;
--]]
local function seed(x,y,tab)
---出界了則返回
if(x<0 or y<0 or x>w or y>h) then
return;
end;
---點的顏色為白色時,返回,不處理。
if(tcl[x][y]==16777215) then
return;
end;
---值為1,則計數加1,返回
if ( tchked[x][y]) then
return ;
else
table.insert(tab,{x=x,y=y} );--添加到連通線里
tchked[x][y]=true;---當值為0時,把值置為1。
seed(x+1,y-1,tab);
seed(x,y-1,tab);
seed(x-1,y-1,tab);
seed(x-1,y,tab);
seed(x+1,y,tab);
seed(x-1,y+1,tab);
seed(x,y+1,tab);
return seed(x+1,y+1,tab); --這里可以用一個尾調用(參考教程中的函數部份),加快遞歸的速度。
end;
end;
---------------------------
----遍歷圖像中的所有點
for i=0,w,1 do
for j=0,h,1 do
---如果是黑色的點,而且沒有被計過數,則調用seed函數。
if(tcl[i][j]==0 and (not tchked[i][j])) then
local tab = {}
seed(i,j,tab);
table.insert(tlines,tab); --添加一條連通線
end;
end;
end;
--現在tlines 里記錄了的有的連通線,我們現在需要根據連通線的長度排序
sproc = function(l,l2)
return table.maxn(l) > table.maxn(l2);--長的連通線排到前面
end;
table.sort(tlines,sproc)
--把圖像全部畫成白色的點
for i=0,w,1 do
for j=0,h,1 do
img:setPos( i , j, 16777215);
end;
end;
--然后把最長的一條連通線畫上去
for i,point in ipairs(tlines[1]) do
img:setPos( point.x, point.y , 0);
end;
--如果需要去掉周圍的空白
if(crop)then
local n = table.maxn(tlines[1])
--排序最長連通線中的所有坐標點
sproc = function(pt,pt2)
return (pt.x <pt2.x );--*左的排前面
end;
table.sort(tlines[1],sproc);
local x,x2 = tlines[1][1].x, tlines[1][n].x;
--排序最長連通線中的所有坐標點
sproc = function(pt,pt2)
return (pt.y <pt2.y );--*上的排前面
end;
table.sort(tlines[1],sproc);
local y,y2 = tlines[1][1].y, tlines[1][n].y;
img:Crop( x,y,x2+1,y2)
end;
end;