基于weka數(shù)據(jù)挖掘工具的設(shè)計(jì)與開發(fā)--粗集分類算法的設(shè)計(jì)與實(shí)現(xiàn).doc
基于weka數(shù)據(jù)挖掘工具的設(shè)計(jì)與開發(fā)--粗集分類算法的設(shè)計(jì)與實(shí)現(xiàn),摘 要隨著大規(guī)模數(shù)據(jù)庫和數(shù)據(jù)倉庫的廣泛應(yīng)用,如何從海量數(shù)據(jù)中獲取有用的知識(shí)成為研究的熱點(diǎn)問題。數(shù)據(jù)挖掘(data mining,dm)的任務(wù)就是在如此海量的數(shù)據(jù)中提取有用的數(shù)據(jù),它在商業(yè)方面的成功應(yīng)用使得各種dm工具接踵而至。weka(懷卡托智能分析系統(tǒng))是一種免費(fèi)且開源的數(shù)據(jù)挖掘軟件,它由新西蘭懷卡托大學(xué)開發(fā),功能強(qiáng)...
內(nèi)容介紹
此文檔由會(huì)員 li484167 發(fā)布摘 要
隨著大規(guī)模數(shù)據(jù)庫和數(shù)據(jù)倉庫的廣泛應(yīng)用,如何從海量數(shù)據(jù)中獲取有用的知識(shí)成為研究的熱點(diǎn)問題。數(shù)據(jù)挖掘(Data Mining,DM)的任務(wù)就是在如此海量的數(shù)據(jù)中提取有用的數(shù)據(jù),它在商業(yè)方面的成功應(yīng)用使得各種DM工具接踵而至。Weka(懷卡托智能分析系統(tǒng))是一種免費(fèi)且開源的數(shù)據(jù)挖掘軟件,它由新西蘭懷卡托大學(xué)開發(fā),功能強(qiáng)大、方便使用,本課題將對(duì)Weka工具進(jìn)行擴(kuò)充開發(fā)。分類是數(shù)據(jù)挖掘的重要分支之一,而粗集理論為處理具有模糊、不精確或不完全信息的分類問題提供了一種新的工具。目前粗集理論已被應(yīng)用于機(jī)器學(xué)習(xí)、故障診斷、關(guān)系數(shù)據(jù)庫中知識(shí)獲取等各種應(yīng)用領(lǐng)域,并取得了很大成功。
本文介紹了數(shù)據(jù)挖掘相關(guān)知識(shí)、技術(shù)和算法以及數(shù)據(jù)挖掘工具Weka的相關(guān)知識(shí)。主要學(xué)習(xí)了粗集理論分類方法的基礎(chǔ),在理解粗集分類算法思想的基礎(chǔ)上,把粗集分類應(yīng)用到數(shù)據(jù)挖掘中。將粗集分類算法集成到數(shù)據(jù)挖掘工具Weka上,擴(kuò)充了Weka系統(tǒng)的功能。
關(guān)鍵詞:數(shù)據(jù)挖掘 分類 粗集 Weka
ABSTRACT
With the widespread use of large databases and data warehouse,How to acquire useful knowledge from large scale of data becomes study focus.The purpose of Data Mining(DM) is withdraw some useful information from a great deal of data,the successful of DM in the commercial application makes a lot of data mining tools emerged.Weka(Waikato Environment for Knowledge Analysis)is one kind of DM tool and we can get it free,it’s also an open-source tool.Weka was developed at the University of Waikato in New Zealand,it’s function is strong and you can easily using it,This assigment will extension develops Weka .classification is one of the important tasks in the field of data mining, Rough Set theory to deal with the fuzzy, inaccurate or incomplete information provided to the classification of a new tool.Now rough set theory has been used in machine learning, fault diagnosis, relational database access to knowledge and other areas of application,and achieved great success.
This dissertation introduces Knowledge of DM and its relative technology as well as its programs,and the related knowledge of the data mining tools of Weka. Study of rough set theory based on the classification method, Set in understanding the rough classification algorithm on the basis of ideology And Set the rough classification applied to the data mining.And set the Rough Set classification algorithm based on expanded the data mining tools of Weka,Weka expansion of the system.
Key Words: Data mining,Classification, Rough Set,Weka
目 錄
第一章 緒 論 - 1 -
1.1設(shè)計(jì)背景 - 1 -
1.2 數(shù)據(jù)挖掘工具在國內(nèi)外應(yīng)用及研究現(xiàn)狀 - 1 -
1.2.1 數(shù)據(jù)挖掘工具的簡(jiǎn)述 - 1 -
1.2.2 國內(nèi)外數(shù)據(jù)挖掘工具應(yīng)用及研究現(xiàn)狀 - 3 -
1.3 本文內(nèi)容 - 6 -
1.4 設(shè)計(jì)成果 - 7 -
第二章 數(shù)據(jù)挖掘及方法的簡(jiǎn)介 - 8 -
2.1概述 - 8 -
2.2數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn) - 8 -
2.2.1 數(shù)據(jù)挖掘的過程 - 8 -
2.2.2 數(shù)據(jù)挖掘的任務(wù) - 10 -
2.2.3 數(shù)據(jù)挖掘方法和技術(shù) - 11 -
2.3 數(shù)據(jù)挖掘技術(shù)的應(yīng)用 - 12 -
2.4本章小結(jié) - 14 -
第三章 數(shù)據(jù)挖掘中的分類技術(shù) - 15 -
3.1概述 - 15 -
3.2數(shù)據(jù)挖掘分類技術(shù) - 15 -
3.2.1分類的基本概念 - 15 -
3.2.2典型分類方法 - 16 -
3.3 本章小結(jié) - 18 -
第四章 粗集理論在分類問題中的應(yīng)用 - 19 -
4.1概述 - 19 -
4.2經(jīng)典粗集理論 - 19 -
4.2.1粗集的基本概念 - 19 -
4.2.2知識(shí)的約簡(jiǎn)與核 - 21 -
4.2.3知識(shí)的相對(duì)約簡(jiǎn)與相對(duì)核 - 21 -
4.2.4知識(shí)的依賴性 - 22 -
4.3信息觀描述粗集 - 23 -
4.4粗集理論在分類問題中的應(yīng)用 - 25 -
4.4.1數(shù)據(jù)集的粗集觀描述 - 25 -
4.4.2屬性約簡(jiǎn) - 26 -
4.4.3基于屬性重要性的啟發(fā)式約簡(jiǎn)算法 - 26 -
4.4.4兩種約簡(jiǎn)算法之比較 - 29 -
4.5基于粗集的分類方法 - 29 -
4.5.1基于屬性約簡(jiǎn)和屬性值約簡(jiǎn)的粗集分類方法 - 30 -
4.5.2另一種粗集分類方法 - 32 -
4.5.3兩種分類方法之比較 - 33 -
4.6 基于粗集理論改進(jìn)經(jīng)典決策樹算法 - 34 -
4.6.1經(jīng)典的決策樹學(xué)習(xí)算法 - 34 -
4.6.2基于屬性重要性度量的多變量決策樹構(gòu)造算法 - 35 -
4.7 本章小結(jié) - 36 -
第五章 基于Weka的分類模型實(shí)現(xiàn) - 37 -
5.1概述 - 37 -
5.2基于Weka分類模型的設(shè)計(jì) - 37 -
5.2.1 Weka系統(tǒng)簡(jiǎn)介 - 37 -
5.2.2對(duì)Weka系統(tǒng)進(jìn)行擴(kuò)充 - 41 -
5.3基于Weka分類模型的測(cè)試 - 45 -
5.4小結(jié) - 49 -
結(jié)束語 - 50 -
致 謝 - 51 -
參考文獻(xiàn) - 52 -