文本分類系統(tǒng)的設計與實現(xiàn).doc
約38頁DOC格式手機打開展開
文本分類系統(tǒng)的設計與實現(xiàn),摘要 分類是數(shù)據(jù)挖掘中一項非常重要的任務,在現(xiàn)實生活中有著廣泛的應用。構(gòu)造分類器的方法很多,常見的有貝葉斯網(wǎng)絡、決策樹、基于實例的學習、人工神經(jīng)網(wǎng)絡、支持向量機等。雖然樸素貝葉斯分類器基于“在給定類標記時屬性值之間相互條件獨立”的假設不現(xiàn)實,但是有監(jiān)督學習表明:其分類性能仍然可與決策樹算法、k-...
內(nèi)容介紹
此文檔由會員 那年三月 發(fā)布
文本分類系統(tǒng)的設計與實現(xiàn)
摘要 分類是數(shù)據(jù)挖掘中一項非常重要的任務,在現(xiàn)實生活中有著廣泛的應用。構(gòu)造分類器的方法很多,常見的有貝葉斯網(wǎng)絡、決策樹、基于實例的學習、人工神經(jīng)網(wǎng)絡、支持向量機等。雖然樸素貝葉斯分類器基于“在給定類標記時屬性值之間相互條件獨立”的假設不現(xiàn)實,但是有監(jiān)督學習表明:其分類性能仍然可與決策樹算法、k-近鄰算法等經(jīng)典算法相當。
雖然單分類器的性能不差,但在日益需求更高的性能的今天,單分類器已經(jīng)不能夠滿足更高的需求。因此集成學習已經(jīng)成為了機器學習和數(shù)據(jù)挖掘領域中的熱門研究方向。
本文介紹和分析了文本分類中常用的分類算法,然后描述了一個基于樸素貝葉斯分類的集成學習方法的向量文本分類系統(tǒng)的基本組成,并給出了一個系統(tǒng)的基本構(gòu)架。在此基礎上設計并實現(xiàn)了一個基于樸素貝葉斯分類的集成學習的向量文本分類系統(tǒng)。