国产精品婷婷久久久久久,国产精品美女久久久浪潮av,草草国产,人妻精品久久无码专区精东影业

中文文本分類系統(tǒng)的設計和實現(xiàn).doc

約35頁DOC格式手機打開展開

中文文本分類系統(tǒng)的設計和實現(xiàn),本文共35頁10819字摘要:文檔自動分類系統(tǒng)是信息處理領域中的一項重要研究課題。本課題論述了一個中文文檔自動分類系統(tǒng)的設計思想、實現(xiàn)過程、開發(fā)環(huán)境、運行環(huán)境和開發(fā)工具,并著重介紹了系統(tǒng)實現(xiàn)中一些主要技術(shù)問題的處理,如文分類模型、特征提取、詞典構(gòu)造等。關鍵詞文本分類分類模型vsm特征提取ab...
編號:10-22243大小:3.88M
分類: 論文>計算機論文

內(nèi)容介紹

此文檔由會員 張陽陽 發(fā)布

中文文本分類系統(tǒng)的設計和實現(xiàn)

本文共35頁 10819字

摘要:文檔自動分類系統(tǒng)是信息處理領域中的一項重要研究課題。本課題論述了一個中文文檔自動分類系統(tǒng)的設計思想、實現(xiàn)過程、開發(fā)環(huán)境、運行環(huán)境和開發(fā)工具,并著重介紹了系統(tǒng)實現(xiàn)中一些主要技術(shù)問題的處理,如文分類模型、特征提取、詞典構(gòu)造等。
關鍵詞 文本分類 分類模型 VSM 特征提取

Abstract:The text classifier is an important research thesis in information field.This thesis has made a brief introduction on the analysis ideas,the realization procedure,the development conditions,the application methods and so on.And it offers a solution of some technological problems,such as,text categorization model,feature extraction and dictionary formlization.
Key words:Text categorization;Categorization model;Vector space model;Feature extraction
目 錄
1、緒論 1
1.1 課題背景 1
1.2 系統(tǒng)概述 2
2、相關技術(shù)介紹 5
2.1 DELPHI的概述 5
2.2 Delphi開發(fā)數(shù)據(jù)庫應用程序 6
2.3 Delphi應用程序框架和設計 6
2.3.1 項目文件 7
2.3.2 單元文件 7
2.3.3 Form文件 7
2.3.4 資源文件 7
2.3.5項目選項和桌面設置文件 7
2.3.6包文件 8
2.4 Delphi多媒體應用程序 8
3、系統(tǒng)的設計 8
3.1 系統(tǒng)需求分析 8
3.2 設計的基本思想 9
3.3 系統(tǒng)的結(jié)構(gòu)設計 9
3.3.1 系統(tǒng)結(jié)構(gòu)圖 9
3.3.2 模塊功能描述 10
3.4 關鍵技術(shù) 11
3.4.1 文檔表示與特征匹配 11
3.4.2 特征提取 12
3.4.3 閥值確定 13
3.4.4 詞條切分 14
3.4.5詞典結(jié)構(gòu)與詞頻統(tǒng)計 14
4、系統(tǒng)的實現(xiàn) 17
4.1 功能模塊的實現(xiàn)和程序框圖 17
4.1.1 創(chuàng)建一個工程 17
4.1.2 語料庫維護模塊 18
4.1.3 詞典維護模塊 18
4.1.4 特征提取 18
4.1.5 文檔分類模塊 19
4.2 系統(tǒng)開發(fā)環(huán)境 21
4.3 運行環(huán)境 22
5、總結(jié) 23
參 考 文 獻 24
附錄 25

參 考 文 獻

[1] 楊宇.《Delphi6.0教程使用手冊》.北京科海集團公司.2001/12
[2] 網(wǎng)冠科技.《Delphi6.0時尚編程百例》.機械工業(yè)出版社.2001/10
[3] 肖帆.《實用編程教程》.北京希望電子出版社.2001/10
[4] 嚴蔚敏.《數(shù)據(jù)結(jié)構(gòu)》.清華大學出版社.1999/7
[5] 上網(wǎng)查找相關內(nèi)容:基于相鄰字對信息的中文文檔分類研究、基于Bayes算法的Web網(wǎng)頁識別、基于向量空間模型的中文文本自動文本分類。