ngaut
asm/c/c++/......
常用鏈接
我的隨筆
我的評(píng)論
我參與的隨筆
留言簿
(31)
給我留言
查看公開(kāi)留言
查看私人留言
隨筆分類(lèi)
(128)
.net winform(1)
(rss)
asio(8)
(rss)
c/c++/ds(47)
(rss)
calculus
(rss)
Compilers:Principles,Techniques,and Tools (21)
(rss)
os study(1)
(rss)
others(50)
(rss)
隨筆檔案
(169)
2011年5月 (2)
2011年1月 (1)
2010年11月 (1)
2010年9月 (4)
2010年8月 (1)
2010年7月 (1)
2010年6月 (1)
2010年5月 (2)
2010年4月 (3)
2010年3月 (2)
2010年2月 (4)
2010年1月 (1)
2009年12月 (2)
2009年11月 (1)
2009年10月 (2)
2009年9月 (3)
2009年8月 (4)
2009年5月 (1)
2009年4月 (1)
2009年2月 (2)
2008年12月 (2)
2008年10月 (4)
2008年9月 (2)
2008年8月 (3)
2008年7月 (4)
2008年6月 (2)
2008年5月 (1)
2008年4月 (4)
2008年3月 (9)
2008年2月 (5)
2008年1月 (2)
2007年12月 (6)
2007年11月 (3)
2007年10月 (2)
2007年8月 (1)
2007年7月 (1)
2007年6月 (3)
2007年5月 (1)
2007年4月 (9)
2007年3月 (1)
2007年2月 (11)
2007年1月 (1)
2006年12月 (3)
2006年11月 (4)
2006年10月 (3)
2006年9月 (6)
2006年8月 (4)
2006年7月 (10)
2006年6月 (3)
2006年5月 (5)
2006年4月 (2)
2006年3月 (1)
2006年1月 (2)
2005年12月 (10)
文章分類(lèi)
NetWork
(rss)
文章檔案
(3)
2008年10月 (2)
2008年4月 (1)
others
.net 設(shè)計(jì)模式牛人
da hua xi you
hzbairly的專(zhuān)欄
先瞄準(zhǔn)目標(biāo)市場(chǎng)再研發(fā)產(chǎn)品
linux內(nèi)核
linux內(nèi)核
linux牛人,調(diào)侃風(fēng)格
經(jīng)典
os 教程
os開(kāi)發(fā)教程
Winter實(shí)驗(yàn)室
某牛
用MSVC開(kāi)發(fā)os
用MSVC開(kāi)發(fā)os
something special
http://vm-kernel.org/blog/
vm and kernel
joshua_yu
網(wǎng)絡(luò)牛人
垃圾堆
安全高手
經(jīng)典的c/c++
absurd的專(zhuān)欄
C++ 有價(jià)值blog索引(不斷更新)
C++ 有價(jià)值blog索引
cppblog的猛男
cppblog的猛男
cppreference
c/c++ standard library reference
crazy-bit
不論你在什么時(shí)候開(kāi)始,重要的是開(kāi)始之后就不要停止。 不論你在什么時(shí)候結(jié)束,重要的是結(jié)束之后就不要悔恨
guanwl的專(zhuān)欄
c++仿基因編程
junguo的專(zhuān)欄
設(shè)計(jì)模式
leotangcw的專(zhuān)欄
some resource aboutwinpcap
linux大牛
linux大牛,也精通windows的說(shuō)
ralph623的專(zhuān)欄(c++高人)
c++高人
寒星軒
c++高手
熊春雷的專(zhuān)欄
c/c++/flex/bison
一雨田的專(zhuān)欄
設(shè)計(jì)模式和網(wǎng)絡(luò)編程
又一個(gè)內(nèi)核的大牛
搜索
積分與排名
積分 - 398642
排名 - 60
最新評(píng)論
1.?re: 當(dāng)asio::async_read與socket的async_read_some的區(qū)別
多個(gè)客戶端同時(shí)發(fā)送數(shù)據(jù),m_packet不會(huì)出問(wèn)題?這個(gè)讀取是多線程的還是單線程的呢?
--xgg
2.?re: 當(dāng)asio::async_read與socket的async_read_some的區(qū)別
謝謝大哥的博客,看了你的這篇文章的時(shí)間,很是崇拜您
--楊立平
3.?re: 二叉樹(shù)的遍歷:前序,中序輸出有點(diǎn)問(wèn)題,但是不知道到怎么修改,想請(qǐng)教各位大神
評(píng)論內(nèi)容較長(zhǎng),點(diǎn)擊標(biāo)題查看
--呆呆笨笨的孩紙
4.?re: 二叉樹(shù)的遍歷:前序,中序,后序,層序--包括遞歸和非遞歸實(shí)現(xiàn)
我自己寫(xiě)的
http://lk1ngaa7.cf/?p=318
--lking
5.?re: 解決unresolved external symbol "public: int __thiscall CWnd::KillTimer(unsigned int)" (?KillTimer@CWnd@@QAEHI@Z)問(wèn)題
評(píng)論內(nèi)容較長(zhǎng),點(diǎn)擊標(biāo)題查看
--lebesgue06
閱讀排行榜
1.?二叉樹(shù)的遍歷:前序,中序,后序,層序--包括遞歸和非遞歸實(shí)現(xiàn)(91622)
2.?解決error C2011: 'fd_set' : 'struct' type redefinition問(wèn)題(16474)
3.?介紹一款國(guó)產(chǎn)開(kāi)源C編譯器(14505)
4.?解決unresolved external symbol "public: int __thiscall CWnd::KillTimer(unsigned int)" (?KillTimer@CWnd@@QAEHI@Z)問(wèn)題(13321)
5.?Database disk image is malformed 解決辦法(11033)
評(píng)論排行榜
1.?二叉樹(shù)的遍歷:前序,中序,后序,層序--包括遞歸和非遞歸實(shí)現(xiàn)(21)
2.?《自己動(dòng)手寫(xiě)嵌入式操作系統(tǒng)》源代碼(14)
3.?看了兩天boost::asio網(wǎng)絡(luò)庫(kù)相關(guān)的資料,寫(xiě)了個(gè)小程序用異步tcp方式來(lái)傳文件,果然高效,速度穩(wěn)定在10M/s左右(13)
4.?前段時(shí)間做的部分筆試題和答案(提醒自己)(9)
5.?最近寫(xiě)了個(gè)小工具,自動(dòng)往代碼里面加入垃圾代碼(9)
Powered by:
博客園
模板提供:
滬江博客
|
首頁(yè)
|
發(fā)新隨筆
|
發(fā)新文章
|
聯(lián)系
| |
管理
[轉(zhuǎn)]開(kāi)源的命令行OCR軟件──tesseract
開(kāi)源的命令行OCR軟件──tesseract
tesseract-ocr
是一個(gè)跨平臺(tái)開(kāi)源的OCR
軟件
(Optical Character Recognition,光學(xué)字符識(shí)別),它歷史悠久,早期是HP實(shí)驗(yàn)室的項(xiàng)目,現(xiàn)
托管
于
google
code。
大部分常用的linux發(fā)行版,應(yīng)該都在源里包含了此軟件,所以u(píng)buntu下只需要 sudo apt-get install tesseract-ocr tesseract-ocr-eng 就可以安裝了,注意必須安裝 tesseract-ocr-eng 這個(gè)是識(shí)別英文字符所必須的
數(shù)據(jù)
文件。而在ubuntu下,也只需要 emerge app-text/tesseract 就可以了,但是也必須給這個(gè)包添加 linguas_en 這個(gè)use,才會(huì)安裝所需要的數(shù)據(jù)文件。
- R I/ Q6 V N- Y* Z# r
關(guān)于數(shù)據(jù)文件,還得交代一下,其實(shí)tesseract在2.0版以后,已經(jīng)有了學(xué)習(xí)能力了,如果你想提高某個(gè)字體的識(shí)別率,或者識(shí)別不在默認(rèn)語(yǔ)言包里的UTF-8字符(比如中文)的話,可以安裝
這個(gè)方法
來(lái)訓(xùn)練出自己的數(shù)據(jù)文件。
& W7 ?, @% i- L/ t' D: X
這個(gè)OCR軟件能干嘛呢?典型地
應(yīng)用
就是識(shí)別驗(yàn)證碼,哈哈。所以以這個(gè)為例,來(lái)介紹一下使用方法,先來(lái)看看這幾個(gè)驗(yàn)證碼(可“圖片另存為”,然后自行測(cè)試):
6 D; W: L7 G. s: H' Y4 y/ \
這幾個(gè)都是用默認(rèn)的數(shù)據(jù)文件能正確識(shí)別的例子,由于tesseract只識(shí)別tiff格式的圖片文件,所以識(shí)別之前,需要將圖片先轉(zhuǎn)成tif格式,具體如下:
$ convert cnblogs.com.jpe ppm:- | ppm2tiff yzm.tif $ tesseract yzm.tif out Tesseract Open Source OCR
Engine
$ cat out.txt 1750
* i' [/ G+ a' U
同時(shí),也有些比較難的驗(yàn)證碼,是程序不能正確識(shí)別的,如下幾個(gè)就是例子:
雖然識(shí)別的正確性不是非常高,但是已經(jīng)很不錯(cuò)了,哈哈。
發(fā)表于 2010-02-22 13:44
ngaut
閱讀(3834)
評(píng)論(1)
編輯
收藏
引用
評(píng)論
#
re: [轉(zhuǎn)]開(kāi)源的命令行OCR軟件──tesseract
回復(fù)
更多評(píng)論
我是此文的作者,你轉(zhuǎn)發(fā)能標(biāo)下出處么?還盜鏈圖片
bones7456
評(píng)論于 2010-10-27 10:04
刷新評(píng)論列表
只有注冊(cè)用戶
登錄
后才能發(fā)表評(píng)論。
【推薦】100%開(kāi)源!大型工業(yè)跨平臺(tái)軟件C++源碼提供,建模,組態(tài)!
網(wǎng)站導(dǎo)航:
博客園
IT新聞
BlogJava
博問(wèn)
Chat2DB
管理
久久综合噜噜激激的五月天
|
无码八A片人妻少妇久久
|
97久久精品国产精品青草
|
日本免费一区二区久久人人澡
|
国产日韩久久久精品影院首页
|
久久国产精品成人免费
|
色综合合久久天天综合绕视看
|
久久无码AV一区二区三区
|
99久久精品国内
|
亚洲人成无码久久电影网站
|
久久精品人人做人人妻人人玩
|
久久艹国产
|
色综合久久综合网观看
|
亚洲国产精品无码久久久不卡
|
av色综合久久天堂av色综合在
|
国产高清国内精品福利99久久
|
婷婷综合久久中文字幕蜜桃三电影
|
九九久久精品国产
|
久久无码av三级
|
久久综合噜噜激激的五月天
|
久久99九九国产免费看小说
|
久久精品国产精品亚洲人人
|
久久无码av三级
|
色成年激情久久综合
|
久久国产精品久久
|
高清免费久久午夜精品
|
久久久久亚洲av无码专区导航
|
一本伊大人香蕉久久网手机
|
国内精品久久久久
|
国产精品视频久久久
|
97超级碰碰碰久久久久
|
久久久无码精品亚洲日韩按摩
|
亚洲国产精品一区二区三区久久
|
久久成人永久免费播放
|
精品久久久无码中文字幕
|
久久噜噜电影你懂的
|
国产精品丝袜久久久久久不卡
|
亚洲一区中文字幕久久
|
久久91这里精品国产2020
|
狠狠精品干练久久久无码中文字幕
|
99久久免费国产精品
|