于主題的web文檔聚類研究.doc
約6頁DOC格式手機打開展開
于主題的web文檔聚類研究,于主題的web文檔聚類研究頁數(shù) 6 字數(shù) 5599 摘要:網(wǎng)絡資源的不斷膨脹和新舊信息的迅速更迭,使傳統(tǒng)的手工分檢的方法難以適應對海量電子數(shù)據(jù)的管理需要。web文檔聚類可以快速地將文檔進行自動歸類,并能夠發(fā)現(xiàn)新的信息資源。針對web文檔數(shù)據(jù)的復雜性,本文提出了通過二次特征提取和聚類的方法,將web文檔按照主題進行自動聚...
內容介紹
此文檔由會員 李亮亮 發(fā)布
于主題的Web文檔聚類研究
頁數(shù) 6 字數(shù) 5599
摘要:網(wǎng)絡資源的不斷膨脹和新舊信息的迅速更迭,使傳統(tǒng)的手工分檢的方法難以適應對海量電子數(shù)據(jù)的管理需要。Web文檔聚類可以快速地將文檔進行自動歸類,并能夠發(fā)現(xiàn)新的信息資源。針對Web文檔數(shù)據(jù)的復雜性,本文提出了通過二次特征提取和聚類的方法,將Web文檔按照主題進行自動聚類。在主題特征被有效提取的同時,實現(xiàn)了較高質量的Web文檔聚類。
關鍵詞:Web文檔聚類,OPTICS算法,特征提取,K近鄰準則,二次特征提取和聚類的方法
參考文獻:
[1]M.Ester, H.-P.Kriegel, J.Sander, and X.Xu. “A density-based algorithm for discovering clusters in large spatial databases.” In Proc. 1996 Int. Conf.Knowledge Discovery and Data Mining(KDD’96),1996.
[2]M.Ankerst, M.Breunig, H.-P. Kriegel, and J.Sander. “OPTICS:Ordering points to identify the clustering structure.” In Proc.1999 ACM-SIGMOD Int. Conf. Management of the Data(SIGMOD’99),1999
[3]邊肇祺,張學工等?!赌J阶R別》,北京,清華大學出版社,2000
[4]Jiawei Han, Micheline Kamber著, 范明, 孟曉峰等譯, 《數(shù)據(jù)挖掘——概念與技術》, 機械工業(yè)出版社, 2001
[5]Yang, Y., Pedersen, J.O. “A Comparative Study on Feature Selection in Text Categorization.” Proc. of the 14th International Conference on Machine Learning ICML97
頁數(shù) 6 字數(shù) 5599
摘要:網(wǎng)絡資源的不斷膨脹和新舊信息的迅速更迭,使傳統(tǒng)的手工分檢的方法難以適應對海量電子數(shù)據(jù)的管理需要。Web文檔聚類可以快速地將文檔進行自動歸類,并能夠發(fā)現(xiàn)新的信息資源。針對Web文檔數(shù)據(jù)的復雜性,本文提出了通過二次特征提取和聚類的方法,將Web文檔按照主題進行自動聚類。在主題特征被有效提取的同時,實現(xiàn)了較高質量的Web文檔聚類。
關鍵詞:Web文檔聚類,OPTICS算法,特征提取,K近鄰準則,二次特征提取和聚類的方法
參考文獻:
[1]M.Ester, H.-P.Kriegel, J.Sander, and X.Xu. “A density-based algorithm for discovering clusters in large spatial databases.” In Proc. 1996 Int. Conf.Knowledge Discovery and Data Mining(KDD’96),1996.
[2]M.Ankerst, M.Breunig, H.-P. Kriegel, and J.Sander. “OPTICS:Ordering points to identify the clustering structure.” In Proc.1999 ACM-SIGMOD Int. Conf. Management of the Data(SIGMOD’99),1999
[3]邊肇祺,張學工等?!赌J阶R別》,北京,清華大學出版社,2000
[4]Jiawei Han, Micheline Kamber著, 范明, 孟曉峰等譯, 《數(shù)據(jù)挖掘——概念與技術》, 機械工業(yè)出版社, 2001
[5]Yang, Y., Pedersen, J.O. “A Comparative Study on Feature Selection in Text Categorization.” Proc. of the 14th International Conference on Machine Learning ICML97
TA們正在看...
- qsy44-2009通用潤滑油基礎油.pdf
- qsygjx0101-2007西氣東輸二線管道工程用熱軋板卷技...pdf
- qsygjx0102-2007西氣東輸二線管道工程用螺旋縫埋弧...pdf
- qsygjx0103-2007西氣東輸二線管道工程用熱軋鋼板技...pdf
- qsygjx0104-2007西氣東輸二線管道工程用直縫埋弧焊...pdf
- 嚴以律己做政治上的“明白人”專題研討發(fā)言稿.doc
- 淺談小型電氣制造企業(yè)人力資源調配.doc
- 非公企業(yè)嚴守政治紀律政治規(guī)矩座談發(fā)言稿.doc
- 領導干部嚴明政治紀律嚴守政治規(guī)矩專題研討發(fā)言稿.doc
- 雙離合式自動變速器零部件有限元分析.doc