ngaut
asm/c/c++/......
常用鏈接
我的隨筆
我的評論
我參與的隨筆
留言簿
(31)
給我留言
查看公開留言
查看私人留言
隨筆分類
(128)
.net winform(1)
(rss)
asio(8)
(rss)
c/c++/ds(47)
(rss)
calculus
(rss)
Compilers:Principles,Techniques,and Tools (21)
(rss)
os study(1)
(rss)
others(50)
(rss)
隨筆檔案
(169)
2011年5月 (2)
2011年1月 (1)
2010年11月 (1)
2010年9月 (4)
2010年8月 (1)
2010年7月 (1)
2010年6月 (1)
2010年5月 (2)
2010年4月 (3)
2010年3月 (2)
2010年2月 (4)
2010年1月 (1)
2009年12月 (2)
2009年11月 (1)
2009年10月 (2)
2009年9月 (3)
2009年8月 (4)
2009年5月 (1)
2009年4月 (1)
2009年2月 (2)
2008年12月 (2)
2008年10月 (4)
2008年9月 (2)
2008年8月 (3)
2008年7月 (4)
2008年6月 (2)
2008年5月 (1)
2008年4月 (4)
2008年3月 (9)
2008年2月 (5)
2008年1月 (2)
2007年12月 (6)
2007年11月 (3)
2007年10月 (2)
2007年8月 (1)
2007年7月 (1)
2007年6月 (3)
2007年5月 (1)
2007年4月 (9)
2007年3月 (1)
2007年2月 (11)
2007年1月 (1)
2006年12月 (3)
2006年11月 (4)
2006年10月 (3)
2006年9月 (6)
2006年8月 (4)
2006年7月 (10)
2006年6月 (3)
2006年5月 (5)
2006年4月 (2)
2006年3月 (1)
2006年1月 (2)
2005年12月 (10)
文章分類
NetWork
(rss)
文章檔案
(3)
2008年10月 (2)
2008年4月 (1)
others
.net 設(shè)計(jì)模式牛人
da hua xi you
hzbairly的專欄
先瞄準(zhǔn)目標(biāo)市場再研發(fā)產(chǎn)品
linux內(nèi)核
linux內(nèi)核
linux牛人,調(diào)侃風(fēng)格
經(jīng)典
os 教程
os開發(fā)教程
Winter實(shí)驗(yàn)室
某牛
用MSVC開發(fā)os
用MSVC開發(fā)os
something special
http://vm-kernel.org/blog/
vm and kernel
joshua_yu
網(wǎng)絡(luò)牛人
垃圾堆
安全高手
經(jīng)典的c/c++
absurd的專欄
C++ 有價(jià)值blog索引(不斷更新)
C++ 有價(jià)值blog索引
cppblog的猛男
cppblog的猛男
cppreference
c/c++ standard library reference
crazy-bit
不論你在什么時(shí)候開始,重要的是開始之后就不要停止。 不論你在什么時(shí)候結(jié)束,重要的是結(jié)束之后就不要悔恨
guanwl的專欄
c++仿基因編程
junguo的專欄
設(shè)計(jì)模式
leotangcw的專欄
some resource aboutwinpcap
linux大牛
linux大牛,也精通windows的說
ralph623的專欄(c++高人)
c++高人
寒星軒
c++高手
熊春雷的專欄
c/c++/flex/bison
一雨田的專欄
設(shè)計(jì)模式和網(wǎng)絡(luò)編程
又一個(gè)內(nèi)核的大牛
搜索
積分與排名
積分 - 396661
排名 - 60
最新評論
1.?re: 當(dāng)asio::async_read與socket的async_read_some的區(qū)別
多個(gè)客戶端同時(shí)發(fā)送數(shù)據(jù),m_packet不會(huì)出問題?這個(gè)讀取是多線程的還是單線程的呢?
--xgg
2.?re: 當(dāng)asio::async_read與socket的async_read_some的區(qū)別
謝謝大哥的博客,看了你的這篇文章的時(shí)間,很是崇拜您
--楊立平
3.?re: 二叉樹的遍歷:前序,中序輸出有點(diǎn)問題,但是不知道到怎么修改,想請教各位大神
評論內(nèi)容較長,點(diǎn)擊標(biāo)題查看
--呆呆笨笨的孩紙
4.?re: 二叉樹的遍歷:前序,中序,后序,層序--包括遞歸和非遞歸實(shí)現(xiàn)
我自己寫的
http://lk1ngaa7.cf/?p=318
--lking
5.?re: 解決unresolved external symbol "public: int __thiscall CWnd::KillTimer(unsigned int)" (?KillTimer@CWnd@@QAEHI@Z)問題
評論內(nèi)容較長,點(diǎn)擊標(biāo)題查看
--lebesgue06
閱讀排行榜
1.?二叉樹的遍歷:前序,中序,后序,層序--包括遞歸和非遞歸實(shí)現(xiàn)(91564)
2.?解決error C2011: 'fd_set' : 'struct' type redefinition問題(16452)
3.?介紹一款國產(chǎn)開源C編譯器(14450)
4.?解決unresolved external symbol "public: int __thiscall CWnd::KillTimer(unsigned int)" (?KillTimer@CWnd@@QAEHI@Z)問題(13291)
5.?Database disk image is malformed 解決辦法(11023)
評論排行榜
1.?二叉樹的遍歷:前序,中序,后序,層序--包括遞歸和非遞歸實(shí)現(xiàn)(21)
2.?《自己動(dòng)手寫嵌入式操作系統(tǒng)》源代碼(14)
3.?看了兩天boost::asio網(wǎng)絡(luò)庫相關(guān)的資料,寫了個(gè)小程序用異步tcp方式來傳文件,果然高效,速度穩(wěn)定在10M/s左右(13)
4.?前段時(shí)間做的部分筆試題和答案(提醒自己)(9)
5.?最近寫了個(gè)小工具,自動(dòng)往代碼里面加入垃圾代碼(9)
Powered by:
博客園
模板提供:
滬江博客
|
首頁
|
發(fā)新隨筆
|
發(fā)新文章
|
聯(lián)系
| |
管理
[轉(zhuǎn)]開源的命令行OCR軟件──tesseract
開源的命令行OCR軟件──tesseract
tesseract-ocr
是一個(gè)跨平臺開源的OCR
軟件
(Optical Character Recognition,光學(xué)字符識別),它歷史悠久,早期是HP實(shí)驗(yàn)室的項(xiàng)目,現(xiàn)
托管
于
google
code。
大部分常用的linux發(fā)行版,應(yīng)該都在源里包含了此軟件,所以ubuntu下只需要 sudo apt-get install tesseract-ocr tesseract-ocr-eng 就可以安裝了,注意必須安裝 tesseract-ocr-eng 這個(gè)是識別英文字符所必須的
數(shù)據(jù)
文件。而在ubuntu下,也只需要 emerge app-text/tesseract 就可以了,但是也必須給這個(gè)包添加 linguas_en 這個(gè)use,才會(huì)安裝所需要的數(shù)據(jù)文件。
- R I/ Q6 V N- Y* Z# r
關(guān)于數(shù)據(jù)文件,還得交代一下,其實(shí)tesseract在2.0版以后,已經(jīng)有了學(xué)習(xí)能力了,如果你想提高某個(gè)字體的識別率,或者識別不在默認(rèn)語言包里的UTF-8字符(比如中文)的話,可以安裝
這個(gè)方法
來訓(xùn)練出自己的數(shù)據(jù)文件。
& W7 ?, @% i- L/ t' D: X
這個(gè)OCR軟件能干嘛呢?典型地
應(yīng)用
就是識別驗(yàn)證碼,哈哈。所以以這個(gè)為例,來介紹一下使用方法,先來看看這幾個(gè)驗(yàn)證碼(可“圖片另存為”,然后自行測試):
6 D; W: L7 G. s: H' Y4 y/ \
這幾個(gè)都是用默認(rèn)的數(shù)據(jù)文件能正確識別的例子,由于tesseract只識別tiff格式的圖片文件,所以識別之前,需要將圖片先轉(zhuǎn)成tif格式,具體如下:
$ convert cnblogs.com.jpe ppm:- | ppm2tiff yzm.tif $ tesseract yzm.tif out Tesseract Open Source OCR
Engine
$ cat out.txt 1750
* i' [/ G+ a' U
同時(shí),也有些比較難的驗(yàn)證碼,是程序不能正確識別的,如下幾個(gè)就是例子:
雖然識別的正確性不是非常高,但是已經(jīng)很不錯(cuò)了,哈哈。
發(fā)表于 2010-02-22 13:44
ngaut
閱讀(3825)
評論(1)
編輯
收藏
引用
評論
#
re: [轉(zhuǎn)]開源的命令行OCR軟件──tesseract
回復(fù)
更多評論
我是此文的作者,你轉(zhuǎn)發(fā)能標(biāo)下出處么?還盜鏈圖片
bones7456
評論于 2010-10-27 10:04
刷新評論列表
只有注冊用戶
登錄
后才能發(fā)表評論。
【推薦】100%開源!大型工業(yè)跨平臺軟件C++源碼提供,建模,組態(tài)!
網(wǎng)站導(dǎo)航:
博客園
IT新聞
BlogJava
博問
Chat2DB
管理
免费国产99久久久香蕉
|
久久久久久久91精品免费观看
|
狠狠精品久久久无码中文字幕
|
国产亚洲色婷婷久久99精品91
|
日本久久久久亚洲中字幕
|
久久久国产99久久国产一
|
久久国产高清一区二区三区
|
久久精品视频免费
|
国产精品热久久无码av
|
色综合久久中文色婷婷
|
94久久国产乱子伦精品免费
|
国产精品久久久久久久久
|
狠狠狠色丁香婷婷综合久久俺
|
久久96国产精品久久久
|
99久久无码一区人妻
|
久久国产一片免费观看
|
久久性精品
|
超级碰碰碰碰97久久久久
|
五月丁香综合激情六月久久
|
久久综合狠狠综合久久
|
久久99国产精品久久
|
久久久中文字幕日本
|
久久久久久久女国产乱让韩
|
国内精品久久久久久99蜜桃
|
久久国产精品久久久
|
久久综合久久伊人
|
99久久国产宗和精品1上映
|
久久精品免费全国观看国产
|
精品久久人人爽天天玩人人妻
|
欧美丰满熟妇BBB久久久
|
青青草原1769久久免费播放
|
久久99精品国产99久久6
|
国内精品人妻无码久久久影院导航
|
久久一日本道色综合久久
|
91精品国产色综久久
|
久久久久久久波多野结衣高潮
|
久久久91精品国产一区二区三区
|
99久久国产综合精品五月天喷水
|
亚洲va久久久久
|
国产精品99久久精品
|
久久人做人爽一区二区三区
|