国产精品婷婷久久久久久,国产精品美女久久久浪潮av,草草国产,人妻精品久久无码专区精东影业

使用字符退化模型和增強(qiáng)算法改進(jìn)ocr的性能[外文翻譯].doc

約7頁DOC格式手機(jī)打開展開

使用字符退化模型和增強(qiáng)算法改進(jìn)ocr的性能[外文翻譯],附件c:譯文使用字符退化模型和增強(qiáng)算法改進(jìn)ocr的性能摘要我們在一個(gè)增強(qiáng)算法中介紹了三個(gè)字符退化模型,用于訓(xùn)練一組字符分類器集合。我們也通過使用字符退化模型獨(dú)立地比較了增強(qiáng)算法集合和網(wǎng)絡(luò)訓(xùn)練的標(biāo)準(zhǔn)算法集合。我們在比較當(dāng)中有一個(gè)有趣的發(fā)現(xiàn):雖然增強(qiáng)算法集合在零拒絕率上比標(biāo)準(zhǔn)算法集合更精確,但增強(qiáng)訓(xùn)練在獨(dú)立訓(xùn)練中的優(yōu)勢會在...
編號:8-99111大小:144.00K
分類: 論文>外文翻譯

內(nèi)容介紹

此文檔由會員 weiyong 發(fā)布

附件C:譯文



使用字符退化模型和增強(qiáng)算法改進(jìn)OCR的性能

摘要
我們在一個(gè)增強(qiáng)算法中介紹了三個(gè)字符退化模型,用于訓(xùn)練一組字符分類器集合。我們也通過使用字符退化模型獨(dú)立地比較了增強(qiáng)算法集合和網(wǎng)絡(luò)訓(xùn)練的標(biāo)準(zhǔn)算法集合。我們在比較當(dāng)中有一個(gè)有趣的發(fā)現(xiàn):雖然增強(qiáng)算法集合在零拒絕率上比標(biāo)準(zhǔn)算法集合更精確,但增強(qiáng)訓(xùn)練在獨(dú)立訓(xùn)練中的優(yōu)勢會在更多的模式被拒絕時(shí)快速消失。最終,標(biāo)準(zhǔn)算法集合在高拒絕率時(shí)表現(xiàn)優(yōu)于增強(qiáng)算法集合。此論文提供了這現(xiàn)象的解釋。

1 導(dǎo)言
在此論文,我們研究增強(qiáng)算法(Drucker et al., 1993)在改進(jìn)OCR性能的效用。增強(qiáng)算法的最初理論工作是由Schapire (1990)完成的。他表明,在原則上它可能是一個(gè)不可靠的分類器組合(其性能略優(yōu)于隨機(jī)猜測)來實(shí)現(xiàn)任意低錯(cuò)誤(在訓(xùn)練數(shù)據(jù)集)。Drucker et al. (1993)應(yīng)用了增強(qiáng)算法來進(jìn)行來字符識別。他們通過以各種程度變形了字符原象產(chǎn)生了大量的訓(xùn)練式樣。結(jié)果表明,通過使用作為增強(qiáng)層級的第一網(wǎng)絡(luò)的單一網(wǎng)絡(luò),字符識別性能大大改善了。但是,它仍然需要回答的是增強(qiáng)算法集合是否勝過獨(dú)立訓(xùn)練網(wǎng)絡(luò)的標(biāo)準(zhǔn)算法集合。在本論文中,我們提供一個(gè)增強(qiáng)算法集合和標(biāo)準(zhǔn)算法集合對比研究。我們也介紹增強(qiáng)算法三種字符退化模型。

2 增強(qiáng)算法
在此增強(qiáng)算法當(dāng)中,那些弱分類器被非等級地訓(xùn)練以學(xué)習(xí)分類問題中越來越困啦的部分。這個(gè)算法需要一部自動計(jì)算機(jī)和邏輯機(jī)來產(chǎn)生大量獨(dú)立訓(xùn)練用的樣本。這個(gè)基礎(chǔ)增強(qiáng)算法運(yùn)行如下:
1) 生成一個(gè)訓(xùn)練用的數(shù)據(jù)集并且訓(xùn)練第一個(gè)分類器。
2) 遵照這樣的法則生成一套用于訓(xùn)練第二個(gè)分類器的數(shù)據(jù):擲一個(gè)硬幣,如果硬幣面朝上,自動計(jì)算機(jī)和邏輯機(jī)生成一個(gè)樣本并將其傳遞到第一個(gè)分類器,若果這個(gè)樣本被錯(cuò)誤分類,則將其加入訓(xùn)練集,否則重復(fù)這個(gè)步驟直至有一個(gè)樣本被錯(cuò)誤分類為止;如果硬幣底朝