于主題的web文檔聚類(lèi)研究.doc

約6頁(yè)DOC格式手機(jī)打開(kāi)展開(kāi)

于主題的web文檔聚類(lèi)研究,于主題的web文檔聚類(lèi)研究頁(yè)數(shù) 6 字?jǐn)?shù) 5599 摘要：網(wǎng)絡(luò)資源的不斷膨脹和新舊信息的迅速更迭，使傳統(tǒng)的手工分檢的方法難以適應(yīng)對(duì)海量電子數(shù)據(jù)的管理需要。web文檔聚類(lèi)可以快速地將文檔進(jìn)行自動(dòng)歸類(lèi)，并能夠發(fā)現(xiàn)新的信息資源。針對(duì)web文檔數(shù)據(jù)的復(fù)雜性，本文提出了通過(guò)二次特征提取和聚類(lèi)的方法，將web文檔按照主題進(jìn)行自動(dòng)聚...
編號(hào):10-28519大小:1.22M
分類(lèi): 論文>計(jì)算機(jī)論文

內(nèi)容介紹

此文檔由會(huì)員李亮亮發(fā)布

于主題的Web文檔聚類(lèi)研究

頁(yè)數(shù) 6 字?jǐn)?shù) 5599

摘要：網(wǎng)絡(luò)資源的不斷膨脹和新舊信息的迅速更迭，使傳統(tǒng)的手工分檢的方法難以適應(yīng)對(duì)海量電子數(shù)據(jù)的管理需要。Web文檔聚類(lèi)可以快速地將文檔進(jìn)行自動(dòng)歸類(lèi)，并能夠發(fā)現(xiàn)新的信息資源。針對(duì)Web文檔數(shù)據(jù)的復(fù)雜性，本文提出了通過(guò)二次特征提取和聚類(lèi)的方法，將Web文檔按照主題進(jìn)行自動(dòng)聚類(lèi)。在主題特征被有效提取的同時(shí)，實(shí)現(xiàn)了較高質(zhì)量的Web文檔聚類(lèi)。

關(guān)鍵詞：Web文檔聚類(lèi),OPTICS算法,特征提取,K近鄰準(zhǔn)則,二次特征提取和聚類(lèi)的方法

參考文獻(xiàn)：
[1]M.Ester, H.-P.Kriegel, J.Sander, and X.Xu. “A density-based algorithm for discovering clusters in large spatial databases.” In Proc. 1996 Int. Conf.Knowledge Discovery and Data Mining(KDD’96),1996.
[2]M.Ankerst, M.Breunig, H.-P. Kriegel, and J.Sander. “OPTICS:Ordering points to identify the clustering structure.” In Proc.1999 ACM-SIGMOD Int. Conf. Management of the Data(SIGMOD’99),1999
[3]邊肇祺，張學(xué)工等?！赌Ｊ阶R(shí)別》，北京，清華大學(xué)出版社，2000
[4]Jiawei Han, Micheline Kamber著, 范明, 孟曉峰等譯, 《數(shù)據(jù)挖掘——概念與技術(shù)》, 機(jī)械工業(yè)出版社, 2001
[5]Yang, Y., Pedersen, J.O. “A Comparative Study on Feature Selection in Text Categorization.” Proc. of the 14th International Conference on Machine Learning ICML97

国产精品婷婷久久久久久,国产精品美女久久久浪潮av,草草国产,人妻精品久久无码专区精东影业

于主題的web文檔聚類(lèi)研究.doc

內(nèi)容介紹

TA們正在看...

相關(guān)文檔

官方微信

支付寶紅包