中文文本分類系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn).doc
約35頁(yè)DOC格式手機(jī)打開展開
中文文本分類系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn),本文共35頁(yè)10819字摘要:文檔自動(dòng)分類系統(tǒng)是信息處理領(lǐng)域中的一項(xiàng)重要研究課題。本課題論述了一個(gè)中文文檔自動(dòng)分類系統(tǒng)的設(shè)計(jì)思想、實(shí)現(xiàn)過程、開發(fā)環(huán)境、運(yùn)行環(huán)境和開發(fā)工具,并著重介紹了系統(tǒng)實(shí)現(xiàn)中一些主要技術(shù)問題的處理,如文分類模型、特征提取、詞典構(gòu)造等。關(guān)鍵詞文本分類分類模型vsm特征提取ab...


內(nèi)容介紹
此文檔由會(huì)員 張陽(yáng)陽(yáng) 發(fā)布
中文文本分類系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)
本文共35頁(yè) 10819字
摘要:文檔自動(dòng)分類系統(tǒng)是信息處理領(lǐng)域中的一項(xiàng)重要研究課題。本課題論述了一個(gè)中文文檔自動(dòng)分類系統(tǒng)的設(shè)計(jì)思想、實(shí)現(xiàn)過程、開發(fā)環(huán)境、運(yùn)行環(huán)境和開發(fā)工具,并著重介紹了系統(tǒng)實(shí)現(xiàn)中一些主要技術(shù)問題的處理,如文分類模型、特征提取、詞典構(gòu)造等。
關(guān)鍵詞 文本分類 分類模型 VSM 特征提取
Abstract:The text classifier is an important research thesis in information field.This thesis has made a brief introduction on the analysis ideas,the realization procedure,the development conditions,the application methods and so on.And it offers a solution of some technological problems,such as,text categorization model,feature extraction and dictionary formlization.
Key words:Text categorization;Categorization model;Vector space model;Feature extraction
目 錄
1、緒論 1
1.1 課題背景 1
1.2 系統(tǒng)概述 2
2、相關(guān)技術(shù)介紹 5
2.1 DELPHI的概述 5
2.2 Delphi開發(fā)數(shù)據(jù)庫(kù)應(yīng)用程序 6
2.3 Delphi應(yīng)用程序框架和設(shè)計(jì) 6
2.3.1 項(xiàng)目文件 7
2.3.2 單元文件 7
2.3.3 Form文件 7
2.3.4 資源文件 7
2.3.5項(xiàng)目選項(xiàng)和桌面設(shè)置文件 7
2.3.6包文件 8
2.4 Delphi多媒體應(yīng)用程序 8
3、系統(tǒng)的設(shè)計(jì) 8
3.1 系統(tǒng)需求分析 8
3.2 設(shè)計(jì)的基本思想 9
3.3 系統(tǒng)的結(jié)構(gòu)設(shè)計(jì) 9
3.3.1 系統(tǒng)結(jié)構(gòu)圖 9
3.3.2 模塊功能描述 10
3.4 關(guān)鍵技術(shù) 11
3.4.1 文檔表示與特征匹配 11
3.4.2 特征提取 12
3.4.3 閥值確定 13
3.4.4 詞條切分 14
3.4.5詞典結(jié)構(gòu)與詞頻統(tǒng)計(jì) 14
4、系統(tǒng)的實(shí)現(xiàn) 17
4.1 功能模塊的實(shí)現(xiàn)和程序框圖 17
4.1.1 創(chuàng)建一個(gè)工程 17
4.1.2 語料庫(kù)維護(hù)模塊 18
4.1.3 詞典維護(hù)模塊 18
4.1.4 特征提取 18
4.1.5 文檔分類模塊 19
4.2 系統(tǒng)開發(fā)環(huán)境 21
4.3 運(yùn)行環(huán)境 22
5、總結(jié) 23
參 考 文 獻(xiàn) 24
附錄 25
參 考 文 獻(xiàn)
[1] 楊宇.《Delphi6.0教程使用手冊(cè)》.北京科海集團(tuán)公司.2001/12
[2] 網(wǎng)冠科技.《Delphi6.0時(shí)尚編程百例》.機(jī)械工業(yè)出版社.2001/10
[3] 肖帆.《實(shí)用編程教程》.北京希望電子出版社.2001/10
[4] 嚴(yán)蔚敏.《數(shù)據(jù)結(jié)構(gòu)》.清華大學(xué)出版社.1999/7
[5] 上網(wǎng)查找相關(guān)內(nèi)容:基于相鄰字對(duì)信息的中文文檔分類研究、基于Bayes算法的Web網(wǎng)頁(yè)識(shí)別、基于向量空間模型的中文文本自動(dòng)文本分類。
本文共35頁(yè) 10819字
摘要:文檔自動(dòng)分類系統(tǒng)是信息處理領(lǐng)域中的一項(xiàng)重要研究課題。本課題論述了一個(gè)中文文檔自動(dòng)分類系統(tǒng)的設(shè)計(jì)思想、實(shí)現(xiàn)過程、開發(fā)環(huán)境、運(yùn)行環(huán)境和開發(fā)工具,并著重介紹了系統(tǒng)實(shí)現(xiàn)中一些主要技術(shù)問題的處理,如文分類模型、特征提取、詞典構(gòu)造等。
關(guān)鍵詞 文本分類 分類模型 VSM 特征提取
Abstract:The text classifier is an important research thesis in information field.This thesis has made a brief introduction on the analysis ideas,the realization procedure,the development conditions,the application methods and so on.And it offers a solution of some technological problems,such as,text categorization model,feature extraction and dictionary formlization.
Key words:Text categorization;Categorization model;Vector space model;Feature extraction
目 錄
1、緒論 1
1.1 課題背景 1
1.2 系統(tǒng)概述 2
2、相關(guān)技術(shù)介紹 5
2.1 DELPHI的概述 5
2.2 Delphi開發(fā)數(shù)據(jù)庫(kù)應(yīng)用程序 6
2.3 Delphi應(yīng)用程序框架和設(shè)計(jì) 6
2.3.1 項(xiàng)目文件 7
2.3.2 單元文件 7
2.3.3 Form文件 7
2.3.4 資源文件 7
2.3.5項(xiàng)目選項(xiàng)和桌面設(shè)置文件 7
2.3.6包文件 8
2.4 Delphi多媒體應(yīng)用程序 8
3、系統(tǒng)的設(shè)計(jì) 8
3.1 系統(tǒng)需求分析 8
3.2 設(shè)計(jì)的基本思想 9
3.3 系統(tǒng)的結(jié)構(gòu)設(shè)計(jì) 9
3.3.1 系統(tǒng)結(jié)構(gòu)圖 9
3.3.2 模塊功能描述 10
3.4 關(guān)鍵技術(shù) 11
3.4.1 文檔表示與特征匹配 11
3.4.2 特征提取 12
3.4.3 閥值確定 13
3.4.4 詞條切分 14
3.4.5詞典結(jié)構(gòu)與詞頻統(tǒng)計(jì) 14
4、系統(tǒng)的實(shí)現(xiàn) 17
4.1 功能模塊的實(shí)現(xiàn)和程序框圖 17
4.1.1 創(chuàng)建一個(gè)工程 17
4.1.2 語料庫(kù)維護(hù)模塊 18
4.1.3 詞典維護(hù)模塊 18
4.1.4 特征提取 18
4.1.5 文檔分類模塊 19
4.2 系統(tǒng)開發(fā)環(huán)境 21
4.3 運(yùn)行環(huán)境 22
5、總結(jié) 23
參 考 文 獻(xiàn) 24
附錄 25
參 考 文 獻(xiàn)
[1] 楊宇.《Delphi6.0教程使用手冊(cè)》.北京科海集團(tuán)公司.2001/12
[2] 網(wǎng)冠科技.《Delphi6.0時(shí)尚編程百例》.機(jī)械工業(yè)出版社.2001/10
[3] 肖帆.《實(shí)用編程教程》.北京希望電子出版社.2001/10
[4] 嚴(yán)蔚敏.《數(shù)據(jù)結(jié)構(gòu)》.清華大學(xué)出版社.1999/7
[5] 上網(wǎng)查找相關(guān)內(nèi)容:基于相鄰字對(duì)信息的中文文檔分類研究、基于Bayes算法的Web網(wǎng)頁(yè)識(shí)別、基于向量空間模型的中文文本自動(dòng)文本分類。