国产精品婷婷久久久久久,国产精品美女久久久浪潮av,草草国产,人妻精品久久无码专区精东影业

中文文本自動校隊中的語料庫技術(shù)研究.doc

約25頁DOC格式手機打開展開

中文文本自動校隊中的語料庫技術(shù)研究,2.4萬字 25頁摘要語料庫語言學(xué)是當(dāng)代計算機學(xué)語言學(xué)中經(jīng)驗主義論取得顯著成效從而在計算機語言學(xué)領(lǐng)域占有一定的優(yōu)勢地位的新學(xué)科方向。語料庫是自然語言處理領(lǐng)域的基礎(chǔ)性資源,因此語料庫建設(shè)和研究就成為計算機語言學(xué)的重要工作之一。本文是研究中文文本中語料庫的建立與設(shè)計。我們采用手工或軟件形式...
編號:10-31652大小:218.00K
分類: 論文>計算機論文

內(nèi)容介紹

此文檔由會員 劉麗 發(fā)布

中文文本自動校隊中的語料庫技術(shù)研究
2.4萬字 25頁


摘要


語料庫語言學(xué)是當(dāng)代計算機學(xué)語言學(xué)中經(jīng)驗主義論取得顯著成效從而在計算機語言學(xué)領(lǐng)域占有一定的優(yōu)勢地位的新學(xué)科方向。語料庫是自然語言處理領(lǐng)域的基礎(chǔ)性資源,因此語料庫建設(shè)和研究就成為計算機語言學(xué)的重要工作之一。本文是研究中文文本中語料庫的建立與設(shè)計。我們采用手工或軟件形式獲得語料庫,并用對語料庫進行加工整理。


關(guān)鍵詞:文本自動校對、語料庫、索引。




Abstract
Corpus Linguistic, a successful empirical methodology, now is a prevailed newtrend in Computational Linguistic field. Corpus is fundamental resource for Natural Language Processing. So some theory and method in different with rational methodology is required that means the construction and research on corpus issue is the basic of Computational Linguistic. This paper attempts to research into corpus for Chinese text. We adopt the handicraft or software form the winning Corpus, and counteract to Corpus proceeds process the sorting.


Keywords: Chinese Proofreading, corpus, index.



參考文獻

[1] 易蓉湘,何克抗 “計算機漢語文稿校對系統(tǒng)” 計算機研究與發(fā)展 1997.5.Vol 34.No5。
[2] 許嘉璐 “中文信息處理技術(shù)現(xiàn)狀及相關(guān)語言文字研究” 軟件世界 1996.4 P13-20.