使用字符退化模型和增強(qiáng)算法改進(jìn)ocr的性能[外文翻譯].doc
約7頁DOC格式手機(jī)打開展開
使用字符退化模型和增強(qiáng)算法改進(jìn)ocr的性能[外文翻譯],附件c:譯文使用字符退化模型和增強(qiáng)算法改進(jìn)ocr的性能摘要我們在一個(gè)增強(qiáng)算法中介紹了三個(gè)字符退化模型,用于訓(xùn)練一組字符分類器集合。我們也通過使用字符退化模型獨(dú)立地比較了增強(qiáng)算法集合和網(wǎng)絡(luò)訓(xùn)練的標(biāo)準(zhǔn)算法集合。我們在比較當(dāng)中有一個(gè)有趣的發(fā)現(xiàn):雖然增強(qiáng)算法集合在零拒絕率上比標(biāo)準(zhǔn)算法集合更精確,但增強(qiáng)訓(xùn)練在獨(dú)立訓(xùn)練中的優(yōu)勢會在...
內(nèi)容介紹
此文檔由會員 weiyong 發(fā)布
附件C:譯文
使用字符退化模型和增強(qiáng)算法改進(jìn)OCR的性能
摘要
我們在一個(gè)增強(qiáng)算法中介紹了三個(gè)字符退化模型,用于訓(xùn)練一組字符分類器集合。我們也通過使用字符退化模型獨(dú)立地比較了增強(qiáng)算法集合和網(wǎng)絡(luò)訓(xùn)練的標(biāo)準(zhǔn)算法集合。我們在比較當(dāng)中有一個(gè)有趣的發(fā)現(xiàn):雖然增強(qiáng)算法集合在零拒絕率上比標(biāo)準(zhǔn)算法集合更精確,但增強(qiáng)訓(xùn)練在獨(dú)立訓(xùn)練中的優(yōu)勢會在更多的模式被拒絕時(shí)快速消失。最終,標(biāo)準(zhǔn)算法集合在高拒絕率時(shí)表現(xiàn)優(yōu)于增強(qiáng)算法集合。此論文提供了這現(xiàn)象的解釋。
1 導(dǎo)言
在此論文,我們研究增強(qiáng)算法(Drucker et al., 1993)在改進(jìn)OCR性能的效用。增強(qiáng)算法的最初理論工作是由Schapire (1990)完成的。他表明,在原則上它可能是一個(gè)不可靠的分類器組合(其性能略優(yōu)于隨機(jī)猜測)來實(shí)現(xiàn)任意低錯(cuò)誤(在訓(xùn)練數(shù)據(jù)集)。Drucker et al. (1993)應(yīng)用了增強(qiáng)算法來進(jìn)行來字符識別。他們通過以各種程度變形了字符原象產(chǎn)生了大量的訓(xùn)練式樣。結(jié)果表明,通過使用作為增強(qiáng)層級的第一網(wǎng)絡(luò)的單一網(wǎng)絡(luò),字符識別性能大大改善了。但是,它仍然需要回答的是增強(qiáng)算法集合是否勝過獨(dú)立訓(xùn)練網(wǎng)絡(luò)的標(biāo)準(zhǔn)算法集合。在本論文中,我們提供一個(gè)增強(qiáng)算法集合和標(biāo)準(zhǔn)算法集合對比研究。我們也介紹增強(qiáng)算法三種字符退化模型。
2 增強(qiáng)算法
在此增強(qiáng)算法當(dāng)中,那些弱分類器被非等級地訓(xùn)練以學(xué)習(xí)分類問題中越來越困啦的部分。這個(gè)算法需要一部自動計(jì)算機(jī)和邏輯機(jī)來產(chǎn)生大量獨(dú)立訓(xùn)練用的樣本。這個(gè)基礎(chǔ)增強(qiáng)算法運(yùn)行如下:
1) 生成一個(gè)訓(xùn)練用的數(shù)據(jù)集并且訓(xùn)練第一個(gè)分類器。
2) 遵照這樣的法則生成一套用于訓(xùn)練第二個(gè)分類器的數(shù)據(jù):擲一個(gè)硬幣,如果硬幣面朝上,自動計(jì)算機(jī)和邏輯機(jī)生成一個(gè)樣本并將其傳遞到第一個(gè)分類器,若果這個(gè)樣本被錯(cuò)誤分類,則將其加入訓(xùn)練集,否則重復(fù)這個(gè)步驟直至有一個(gè)樣本被錯(cuò)誤分類為止;如果硬幣底朝
使用字符退化模型和增強(qiáng)算法改進(jìn)OCR的性能
摘要
我們在一個(gè)增強(qiáng)算法中介紹了三個(gè)字符退化模型,用于訓(xùn)練一組字符分類器集合。我們也通過使用字符退化模型獨(dú)立地比較了增強(qiáng)算法集合和網(wǎng)絡(luò)訓(xùn)練的標(biāo)準(zhǔn)算法集合。我們在比較當(dāng)中有一個(gè)有趣的發(fā)現(xiàn):雖然增強(qiáng)算法集合在零拒絕率上比標(biāo)準(zhǔn)算法集合更精確,但增強(qiáng)訓(xùn)練在獨(dú)立訓(xùn)練中的優(yōu)勢會在更多的模式被拒絕時(shí)快速消失。最終,標(biāo)準(zhǔn)算法集合在高拒絕率時(shí)表現(xiàn)優(yōu)于增強(qiáng)算法集合。此論文提供了這現(xiàn)象的解釋。
1 導(dǎo)言
在此論文,我們研究增強(qiáng)算法(Drucker et al., 1993)在改進(jìn)OCR性能的效用。增強(qiáng)算法的最初理論工作是由Schapire (1990)完成的。他表明,在原則上它可能是一個(gè)不可靠的分類器組合(其性能略優(yōu)于隨機(jī)猜測)來實(shí)現(xiàn)任意低錯(cuò)誤(在訓(xùn)練數(shù)據(jù)集)。Drucker et al. (1993)應(yīng)用了增強(qiáng)算法來進(jìn)行來字符識別。他們通過以各種程度變形了字符原象產(chǎn)生了大量的訓(xùn)練式樣。結(jié)果表明,通過使用作為增強(qiáng)層級的第一網(wǎng)絡(luò)的單一網(wǎng)絡(luò),字符識別性能大大改善了。但是,它仍然需要回答的是增強(qiáng)算法集合是否勝過獨(dú)立訓(xùn)練網(wǎng)絡(luò)的標(biāo)準(zhǔn)算法集合。在本論文中,我們提供一個(gè)增強(qiáng)算法集合和標(biāo)準(zhǔn)算法集合對比研究。我們也介紹增強(qiáng)算法三種字符退化模型。
2 增強(qiáng)算法
在此增強(qiáng)算法當(dāng)中,那些弱分類器被非等級地訓(xùn)練以學(xué)習(xí)分類問題中越來越困啦的部分。這個(gè)算法需要一部自動計(jì)算機(jī)和邏輯機(jī)來產(chǎn)生大量獨(dú)立訓(xùn)練用的樣本。這個(gè)基礎(chǔ)增強(qiáng)算法運(yùn)行如下:
1) 生成一個(gè)訓(xùn)練用的數(shù)據(jù)集并且訓(xùn)練第一個(gè)分類器。
2) 遵照這樣的法則生成一套用于訓(xùn)練第二個(gè)分類器的數(shù)據(jù):擲一個(gè)硬幣,如果硬幣面朝上,自動計(jì)算機(jī)和邏輯機(jī)生成一個(gè)樣本并將其傳遞到第一個(gè)分類器,若果這個(gè)樣本被錯(cuò)誤分類,則將其加入訓(xùn)練集,否則重復(fù)這個(gè)步驟直至有一個(gè)樣本被錯(cuò)誤分類為止;如果硬幣底朝
TA們正在看...
- 商品房地下車位權(quán)屬問題研究.rar
- 我國開征物業(yè)稅的可行性研究.rar
- 藥品專利權(quán)與公共健康權(quán)的關(guān)系.rar
- 金融危機(jī)背景下中國汽車產(chǎn)業(yè)發(fā)展研究.doc
- 比較優(yōu)勢理論的新發(fā)展.doc
- 網(wǎng)絡(luò)時(shí)代中間商的生存與發(fā)展問題研究.doc
- 中國零售業(yè)國際化經(jīng)營研究.doc
- 國外對華反傾銷現(xiàn)狀及我國應(yīng)對策略研究.doc
- 論破產(chǎn)重整制度的經(jīng)濟(jì)法屬性.rar
- 論重整中的信息披露制度.rar