ngaut
asm/c/c++/......
常用鏈接
我的隨筆
我的評(píng)論
我參與的隨筆
留言簿
(31)
給我留言
查看公開留言
查看私人留言
隨筆分類
(128)
.net winform(1)
(rss)
asio(8)
(rss)
c/c++/ds(47)
(rss)
calculus
(rss)
Compilers:Principles,Techniques,and Tools (21)
(rss)
os study(1)
(rss)
others(50)
(rss)
隨筆檔案
(169)
2011年5月 (2)
2011年1月 (1)
2010年11月 (1)
2010年9月 (4)
2010年8月 (1)
2010年7月 (1)
2010年6月 (1)
2010年5月 (2)
2010年4月 (3)
2010年3月 (2)
2010年2月 (4)
2010年1月 (1)
2009年12月 (2)
2009年11月 (1)
2009年10月 (2)
2009年9月 (3)
2009年8月 (4)
2009年5月 (1)
2009年4月 (1)
2009年2月 (2)
2008年12月 (2)
2008年10月 (4)
2008年9月 (2)
2008年8月 (3)
2008年7月 (4)
2008年6月 (2)
2008年5月 (1)
2008年4月 (4)
2008年3月 (9)
2008年2月 (5)
2008年1月 (2)
2007年12月 (6)
2007年11月 (3)
2007年10月 (2)
2007年8月 (1)
2007年7月 (1)
2007年6月 (3)
2007年5月 (1)
2007年4月 (9)
2007年3月 (1)
2007年2月 (11)
2007年1月 (1)
2006年12月 (3)
2006年11月 (4)
2006年10月 (3)
2006年9月 (6)
2006年8月 (4)
2006年7月 (10)
2006年6月 (3)
2006年5月 (5)
2006年4月 (2)
2006年3月 (1)
2006年1月 (2)
2005年12月 (10)
文章分類
NetWork
(rss)
文章檔案
(3)
2008年10月 (2)
2008年4月 (1)
others
.net 設(shè)計(jì)模式牛人
da hua xi you
hzbairly的專欄
先瞄準(zhǔn)目標(biāo)市場(chǎng)再研發(fā)產(chǎn)品
linux內(nèi)核
linux內(nèi)核
linux牛人,調(diào)侃風(fēng)格
經(jīng)典
os 教程
os開發(fā)教程
Winter實(shí)驗(yàn)室
某牛
用MSVC開發(fā)os
用MSVC開發(fā)os
something special
http://vm-kernel.org/blog/
vm and kernel
joshua_yu
網(wǎng)絡(luò)牛人
垃圾堆
安全高手
經(jīng)典的c/c++
absurd的專欄
C++ 有價(jià)值blog索引(不斷更新)
C++ 有價(jià)值blog索引
cppblog的猛男
cppblog的猛男
cppreference
c/c++ standard library reference
crazy-bit
不論你在什么時(shí)候開始,重要的是開始之后就不要停止。 不論你在什么時(shí)候結(jié)束,重要的是結(jié)束之后就不要悔恨
guanwl的專欄
c++仿基因編程
junguo的專欄
設(shè)計(jì)模式
leotangcw的專欄
some resource aboutwinpcap
linux大牛
linux大牛,也精通windows的說
ralph623的專欄(c++高人)
c++高人
寒星軒
c++高手
熊春雷的專欄
c/c++/flex/bison
一雨田的專欄
設(shè)計(jì)模式和網(wǎng)絡(luò)編程
又一個(gè)內(nèi)核的大牛
搜索
積分與排名
積分 - 397790
排名 - 60
最新評(píng)論
1.?re: 當(dāng)asio::async_read與socket的async_read_some的區(qū)別
多個(gè)客戶端同時(shí)發(fā)送數(shù)據(jù),m_packet不會(huì)出問題?這個(gè)讀取是多線程的還是單線程的呢?
--xgg
2.?re: 當(dāng)asio::async_read與socket的async_read_some的區(qū)別
謝謝大哥的博客,看了你的這篇文章的時(shí)間,很是崇拜您
--楊立平
3.?re: 二叉樹的遍歷:前序,中序輸出有點(diǎn)問題,但是不知道到怎么修改,想請(qǐng)教各位大神
評(píng)論內(nèi)容較長(zhǎng),點(diǎn)擊標(biāo)題查看
--呆呆笨笨的孩紙
4.?re: 二叉樹的遍歷:前序,中序,后序,層序--包括遞歸和非遞歸實(shí)現(xiàn)
我自己寫的
http://lk1ngaa7.cf/?p=318
--lking
5.?re: 解決unresolved external symbol "public: int __thiscall CWnd::KillTimer(unsigned int)" (?KillTimer@CWnd@@QAEHI@Z)問題
評(píng)論內(nèi)容較長(zhǎng),點(diǎn)擊標(biāo)題查看
--lebesgue06
閱讀排行榜
1.?二叉樹的遍歷:前序,中序,后序,層序--包括遞歸和非遞歸實(shí)現(xiàn)(91584)
2.?解決error C2011: 'fd_set' : 'struct' type redefinition問題(16466)
3.?介紹一款國(guó)產(chǎn)開源C編譯器(14479)
4.?解決unresolved external symbol "public: int __thiscall CWnd::KillTimer(unsigned int)" (?KillTimer@CWnd@@QAEHI@Z)問題(13308)
5.?Database disk image is malformed 解決辦法(11028)
評(píng)論排行榜
1.?二叉樹的遍歷:前序,中序,后序,層序--包括遞歸和非遞歸實(shí)現(xiàn)(21)
2.?《自己動(dòng)手寫嵌入式操作系統(tǒng)》源代碼(14)
3.?看了兩天boost::asio網(wǎng)絡(luò)庫(kù)相關(guān)的資料,寫了個(gè)小程序用異步tcp方式來(lái)傳文件,果然高效,速度穩(wěn)定在10M/s左右(13)
4.?前段時(shí)間做的部分筆試題和答案(提醒自己)(9)
5.?最近寫了個(gè)小工具,自動(dòng)往代碼里面加入垃圾代碼(9)
Powered by:
博客園
模板提供:
滬江博客
|
首頁(yè)
|
發(fā)新隨筆
|
發(fā)新文章
|
聯(lián)系
| |
管理
[轉(zhuǎn)]開源的命令行OCR軟件──tesseract
開源的命令行OCR軟件──tesseract
tesseract-ocr
是一個(gè)跨平臺(tái)開源的OCR
軟件
(Optical Character Recognition,光學(xué)字符識(shí)別),它歷史悠久,早期是HP實(shí)驗(yàn)室的項(xiàng)目,現(xiàn)
托管
于
google
code。
大部分常用的linux發(fā)行版,應(yīng)該都在源里包含了此軟件,所以u(píng)buntu下只需要 sudo apt-get install tesseract-ocr tesseract-ocr-eng 就可以安裝了,注意必須安裝 tesseract-ocr-eng 這個(gè)是識(shí)別英文字符所必須的
數(shù)據(jù)
文件。而在ubuntu下,也只需要 emerge app-text/tesseract 就可以了,但是也必須給這個(gè)包添加 linguas_en 這個(gè)use,才會(huì)安裝所需要的數(shù)據(jù)文件。
- R I/ Q6 V N- Y* Z# r
關(guān)于數(shù)據(jù)文件,還得交代一下,其實(shí)tesseract在2.0版以后,已經(jīng)有了學(xué)習(xí)能力了,如果你想提高某個(gè)字體的識(shí)別率,或者識(shí)別不在默認(rèn)語(yǔ)言包里的UTF-8字符(比如中文)的話,可以安裝
這個(gè)方法
來(lái)訓(xùn)練出自己的數(shù)據(jù)文件。
& W7 ?, @% i- L/ t' D: X
這個(gè)OCR軟件能干嘛呢?典型地
應(yīng)用
就是識(shí)別驗(yàn)證碼,哈哈。所以以這個(gè)為例,來(lái)介紹一下使用方法,先來(lái)看看這幾個(gè)驗(yàn)證碼(可“圖片另存為”,然后自行測(cè)試):
6 D; W: L7 G. s: H' Y4 y/ \
這幾個(gè)都是用默認(rèn)的數(shù)據(jù)文件能正確識(shí)別的例子,由于tesseract只識(shí)別tiff格式的圖片文件,所以識(shí)別之前,需要將圖片先轉(zhuǎn)成tif格式,具體如下:
$ convert cnblogs.com.jpe ppm:- | ppm2tiff yzm.tif $ tesseract yzm.tif out Tesseract Open Source OCR
Engine
$ cat out.txt 1750
* i' [/ G+ a' U
同時(shí),也有些比較難的驗(yàn)證碼,是程序不能正確識(shí)別的,如下幾個(gè)就是例子:
雖然識(shí)別的正確性不是非常高,但是已經(jīng)很不錯(cuò)了,哈哈。
發(fā)表于 2010-02-22 13:44
ngaut
閱讀(3830)
評(píng)論(1)
編輯
收藏
引用
評(píng)論
#
re: [轉(zhuǎn)]開源的命令行OCR軟件──tesseract
回復(fù)
更多評(píng)論
我是此文的作者,你轉(zhuǎn)發(fā)能標(biāo)下出處么?還盜鏈圖片
bones7456
評(píng)論于 2010-10-27 10:04
刷新評(píng)論列表
只有注冊(cè)用戶
登錄
后才能發(fā)表評(píng)論。
【推薦】100%開源!大型工業(yè)跨平臺(tái)軟件C++源碼提供,建模,組態(tài)!
網(wǎng)站導(dǎo)航:
博客園
IT新聞
BlogJava
博問
Chat2DB
管理
国色天香久久久久久久小说
|
国产精品女同久久久久电影院
|
国产午夜精品久久久久免费视
|
久久精品亚洲日本波多野结衣
|
国产精品久久自在自线观看
|
久久精品国产WWW456C0M
|
伊人久久亚洲综合影院
|
久久精品国产亚洲av水果派
|
精品久久久久一区二区三区
|
久久www免费人成看片
|
69久久夜色精品国产69
|
一本大道久久香蕉成人网
|
久久国产亚洲精品麻豆
|
欧美成人免费观看久久
|
伊人久久免费视频
|
日韩精品久久久肉伦网站
|
蜜臀久久99精品久久久久久
|
久久久久AV综合网成人
|
国内精品久久久久影院亚洲
|
久久综合久久综合久久
|
麻豆AV一区二区三区久久
|
无码精品久久一区二区三区
|
91精品久久久久久无码
|
国产精品女同久久久久电影院
|
国内精品久久久久影院老司
|
久久久久国产精品麻豆AR影院
|
国产亚洲婷婷香蕉久久精品
|
久久精品国产亚洲AV香蕉
|
精品久久久久久久国产潘金莲
|
免费一级欧美大片久久网
|
99久久99久久精品国产片果冻
|
国产美女久久精品香蕉69
|
日日噜噜夜夜狠狠久久丁香五月
|
国产2021久久精品
|
精品无码久久久久国产
|
久久精品国产亚洲AV嫖农村妇女
|
精品久久久中文字幕人妻
|
久久婷婷国产剧情内射白浆
|
午夜精品久久久久
|
国产激情久久久久久熟女老人
|
久久精品国产乱子伦
|