樸素貝葉斯分類器的設(shè)計(jì)與實(shí)現(xiàn).doc
約33頁DOC格式手機(jī)打開展開
樸素貝葉斯分類器的設(shè)計(jì)與實(shí)現(xiàn),摘要 近年來,隨著信息存儲(chǔ)技術(shù)和通信技術(shù)的迅猛發(fā)展,大量的文字信息開始以計(jì)算機(jī)可讀的形式存在,并且其數(shù)量每日劇增。這些文字包羅萬象,用戶往往只需要其中的一部分,如果通過人工的手段對這些龐大的原始文檔集進(jìn)行組織和整理,不僅費(fèi)時(shí)費(fèi)力,效果也未必理想;相較之下,如果能使用計(jì)算機(jī)直接對文檔信息進(jìn)行過...
內(nèi)容介紹
此文檔由會(huì)員 那年三月 發(fā)布
樸素貝葉斯分類器的設(shè)計(jì)與實(shí)現(xiàn)
摘要 近年來,隨著信息存儲(chǔ)技術(shù)和通信技術(shù)的迅猛發(fā)展,大量的文字信息開始以計(jì)算機(jī)可讀的形式存在,并且其數(shù)量每日劇增。這些文字包羅萬象,用戶往往只需要其中的一部分,如果通過人工的手段對這些龐大的原始文檔集進(jìn)行組織和整理,不僅費(fèi)時(shí)費(fèi)力,效果也未必理想;相較之下,如果能使用計(jì)算機(jī)直接對文檔信息進(jìn)行過濾、分類,提交給用戶他真正感興趣的部分,就能把用戶從繁雜的文檔處理工作中解放出來,從而大大提高了信息的利用率。
樸素貝葉斯算法是一種簡單,有效的文本分類算法,有著廣泛的應(yīng)用。本文針對樸素貝葉斯算法進(jìn)行研究,該算法的基本思路是,先將訓(xùn)練文本集中的所有文本進(jìn)行分詞預(yù)處理,并將預(yù)處理后得到的特征向量集儲(chǔ)存起來