nsprint算法的研究與應(yīng)用.rar
nsprint算法的研究與應(yīng)用,摘 要隨著數(shù)據(jù)挖掘分類技術(shù)的廣泛應(yīng)用,決策樹在數(shù)據(jù)挖掘技術(shù)中的作用越來越重要,并且取得了眾多的研究成果。實際應(yīng)用中由于存儲數(shù)據(jù)量爆炸性的增長,使許多算法挖掘效率下降,而傳統(tǒng)的決策樹算法已經(jīng)不能很好的從海量的數(shù)據(jù)中找出有用的信息,使得它的應(yīng)用受到了一定的局限性。為了解決決策樹算法應(yīng)用的局限性問題,本文著重對決策樹挖掘算法...
該文檔為壓縮文件,包含的文件列表如下:
內(nèi)容介紹
原文檔由會員 li484167 發(fā)布摘 要
隨著數(shù)據(jù)挖掘分類技術(shù)的廣泛應(yīng)用,決策樹在數(shù)據(jù)挖掘技術(shù)中的作用越來越重要,并且取得了眾多的研究成果。實際應(yīng)用中由于存儲數(shù)據(jù)量爆炸性的增長,使許多算法挖掘效率下降,而傳統(tǒng)的決策樹算法已經(jīng)不能很好的從海量的數(shù)據(jù)中找出有用的信息,使得它的應(yīng)用受到了一定的局限性。為了解決決策樹算法應(yīng)用的局限性問題,本文著重對決策樹挖掘算法進(jìn)行了研究,在現(xiàn)有算法的基礎(chǔ)上對SPRINT算法進(jìn)行改進(jìn),并運(yùn)用改進(jìn)的算法對影響本科生創(chuàng)新能力的主要因素進(jìn)行挖掘。主要的研究工作集中體現(xiàn)在以下幾個方面:
(1)對經(jīng)典決策樹算法的理論和實現(xiàn)原理進(jìn)行了研究;深入分析了SPRINT算法,針對該算法的不足進(jìn)行了改進(jìn),并將改進(jìn)算法與原有算法進(jìn)行了測試;對Eclipse開發(fā)平臺的結(jié)構(gòu)和Weka平臺的結(jié)構(gòu)、功能、內(nèi)核進(jìn)行了分析。
(2)在上述研究的理論方法的基礎(chǔ)上,對SPRINT算法中關(guān)鍵的成員變量、方法以及數(shù)據(jù)結(jié)構(gòu)進(jìn)行設(shè)計,根據(jù)規(guī)則建立分類器,將SPRINT算法封裝進(jìn)Weka平臺中,并通過實例將封裝的SPRINT算法與Weka平臺自帶的J4.8算法(即C4.5算法)進(jìn)行比較測試。
(3)將封裝的SPRINT算法應(yīng)用到學(xué)生創(chuàng)新能力挖掘中,對分類的結(jié)果進(jìn)行分析,總結(jié)出學(xué)生創(chuàng)新能力與教學(xué)方法的之間的關(guān)系,為教師指導(dǎo)學(xué)生提供決策支持。
(4)最后對改進(jìn)的SPRINT算法的理論思想和實驗原理進(jìn)行了詳細(xì)的總結(jié),同時對論文存在的問題做了說明,展望下一步的工作。
關(guān)鍵詞:數(shù)據(jù)挖掘;決策樹算法;數(shù)據(jù)挖掘平臺;創(chuàng)新能力;創(chuàng)新能力挖掘
Abstract
With the extensive applications of classifying technology of data mining, decision tree classifier has achieved much research achievement. In practical applications the efficiency of many mining algorithms declines with the explosive growth of data storage.The traditional decision-making tree algorithms has already could not find out useful information from a mass of data well. It makes the application subject to certain limitations. In order to resolve the open questions of decision-making tree algorithms, this thesis focuses on the research of decision tree mining algorithms. Improve the SPRINT algorithm based on the existing algorithm and excavate the major factor that impact innovative capability of students by using improved algorithms. Researchs of this thesis mainly reflects in the following aspects:
Research the theory of the classical decision-making tree algorithms, especially SPRINT algorithm. Improve the SPRINT algorithm according to the original algorithm’s shortages. Analyse the structure of Eclipse platform and the structure, function, kernel of Weka platform.
Design the key member variables, methods and data structure of the SPRINT algorithm based on the above-mentioned theory. Establish classification by rules, encapsulate SPRINT algorithm into the Weka platform .And compare encapsulated SPRINT algorithm with the J4.8 algorithm (C4.5 algorithm) that comes with Weka platform by examples.
Apply encapsulated SPRINT algorithm to the excavation of the students’innovation ability.Analyze the results of classification; sum up the relationship between the students’ innovation ability and teaching methods, which provide decision support for teacher.
Summarize the principle of the improved SPRINT algorithm.Look forward to the next phase of work at the same time.
Keywords:Data Mining; Decision Tree Algorithm; Data Mining Platform; Innovation Ability; Innovation Ability Mining
目 錄
摘 要 i
Abstract ii
第1章 引 言 1
1. 1 研究背景和意義 1
1.2 國內(nèi)外研究現(xiàn)狀 1
1.2.1 Weka的國內(nèi)外研究現(xiàn)狀 1
1.2.2 決策樹的研究現(xiàn)狀 2
1.3.本文的主要內(nèi)容 3
第2章 決策樹算法及其改進(jìn) 4
2.1 決策樹的構(gòu)造過程 4
2.2決策樹算法 5
2.2.1對ID3算法的深入分析 5
2.2.2 對C4.5算法的深入分析 6
2.2.3 對SLIQ算法的深入分析 6
2.2.4 對SPRINT算法的深入分析 7
2.2.5 決策樹算法的比較 11
2.3 SPRINT算法的改進(jìn) 12
2.4 改進(jìn)算法的測試 14
2.5 小結(jié) 15
第3章 改進(jìn)算法的封裝與應(yīng)用 16
3.1 平臺的選擇 16
3.1.1 開發(fā)平臺的選擇 16
3.1.2 數(shù)據(jù)挖掘平臺的選擇 16
3.1.3 Weka框架設(shè)計 16
3.2.改進(jìn)的SPRINT算法設(shè)計與封裝 22
3.2.1 關(guān)鍵成員變量、成員方法和數(shù)據(jù)結(jié)構(gòu)的設(shè)計 22
3.2.2 部分程序體設(shè)計 24
3.2.3 算法的封裝 25
3.3 算法測試 27
3.3.1 圖形用戶界面調(diào)用過程 27
3.3.2 測試結(jié)果分析 29
3.4 實例 32
3.4.1 創(chuàng)新的內(nèi)涵 32
3.4.2 分析數(shù)據(jù)背景 33
3.4.3 數(shù)據(jù)預(yù)處理與轉(zhuǎn)換 35
3.4.4 Weka挖掘的結(jié)果 36
3.4.5 挖掘的結(jié)果分析 38
3.4.6 課程教學(xué)調(diào)整建議 38
3.5 本章小結(jié) 39
第4章 總結(jié)與展望 40
4.1 工作總結(jié) 40
4.2 進(jìn)一步研究工作展望 40
參考文獻(xiàn) 42
研究生期間發(fā)表論文 44
致 謝 45
附錄 46