国产精品婷婷久久久久久,国产精品美女久久久浪潮av,草草国产,人妻精品久久无码专区精东影业

中文文本自動查錯.doc

約11頁DOC格式手機打開展開

中文文本自動查錯,5000余字基于互信息的摘要本文介紹有關互信息的概念和理論,討論了從語料庫提取漢字互信息的方法,并且構造了基于漢字互信息的算法,將算法編寫程序調(diào)試通過,給出了部分查錯實例。關鍵詞二元接續(xù)關系互信息abstract this dissertation int...
編號:10-30834大小:593.50K
分類: 論文>計算機論文

內(nèi)容介紹

此文檔由會員 Facebook 發(fā)布

中文文本自動查錯 5000余字

基于互信息的中文文本自動查錯

摘要 本文介紹有關互信息的概念和理論,討論了從語料庫提取漢字互信息的方法,并且構造了基于漢字互信息的中文文本自動查錯算法,將算法編寫程序調(diào)試通過,給出了部分查錯實例。
關鍵詞 中文文本自動查錯 二元接續(xù)關系 互信息

Abstract This dissertation introduced some concepts and theories about Mutual Information. Then discussed the method of how to pick up Mutual Information form sentences-base. At last, construct the Auto-Error-Check Algorithm of Chinese Text based on Mutual Information and compile th


目 錄
1. 概述 3
1.1 問題提出 3
1.2 研究狀況及方法 3
1.2.1 基于規(guī)則的查錯方法 3
1.2.2 基于統(tǒng)計的查錯方法 3
1.2.3 待校對文本常見錯誤分析 3
1.3 本文研究思路 4
2. 基于互信息的自動查錯方法 4
2.1 互信息知識庫的構造 4
2.1 數(shù)據(jù)結構設計 4
2.2 互信息計算算法設計 5
2.2 使用互信息數(shù)據(jù)進行文本查錯 7
2.2.1 基于互信息的文本查錯算法描述 7
2.2.2 基于互信息的文本查錯算法流程圖 8
2.2.3 程序設計實現(xiàn)和實驗結果 8
3.實驗實例 9
4. 結論 10
5. 致謝 11
6. 參考文獻 11
7. 附錄 11




部分參考文獻


《基于二元接續(xù)關系檢查的字詞級自動查錯方法》
張仰森 丁冰青《中文信息學報》第15卷第3期
《中文信息處理與現(xiàn)代漢語研究》
許嘉璐 中國語文2000年第6期(總第279期)
《語料庫語言學》黃昌寧 李涓子 商務印書館 2002年4月第1版