關(guān)于單數(shù)據(jù)流和分布式數(shù)據(jù)流挖掘分類算法的研究.doc
約44頁DOC格式手機打開展開
關(guān)于單數(shù)據(jù)流和分布式數(shù)據(jù)流挖掘分類算法的研究,摘 要隨著科學技術(shù)的發(fā)展,社會經(jīng)濟不斷進步,在社會生產(chǎn)的各個領(lǐng)域中都產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)中蘊含著大量的豐富的信息。但是,如何處理這些數(shù)據(jù)并從中得到有用的信息,是對當今計算機科學研究的一項重大的挑戰(zhàn)。數(shù)據(jù)挖掘技術(shù)成為了當前研究的一項重要的課題。近年來,單數(shù)據(jù)流的挖掘得到了...


內(nèi)容介紹
此文檔由會員 陳海峰 發(fā)布
關(guān)于單數(shù)據(jù)流和分布式數(shù)據(jù)流挖掘分類算法的研究
摘 要
隨著科學技術(shù)的發(fā)展,社會經(jīng)濟不斷進步,在社會生產(chǎn)的各個領(lǐng)域中都產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)中蘊含著大量的豐富的信息。但是,如何處理這些數(shù)據(jù)并從中得到有用的信息,是對當今計算機科學研究的一項重大的挑戰(zhàn)。數(shù)據(jù)挖掘技術(shù)成為了當前研究的一項重要的課題。近年來,單數(shù)據(jù)流的挖掘得到了廣泛的研究,提出了許多有價值的模型和算法。但是,隨著網(wǎng)絡環(huán)境應用的普及,單一數(shù)據(jù)流的應用必然向著多節(jié)點的分布式數(shù)據(jù)流方向轉(zhuǎn)移,并有著廣泛的應用前景。本課題闡述了當前國際上關(guān)于單數(shù)據(jù)流和分布式數(shù)據(jù)流挖掘分類算法的研究現(xiàn)狀,按照算法學習模式的方法,對各種分類算法進行比較、歸納,同時,對分類技術(shù)當前所面臨的問題和發(fā)展趨勢進行了總結(jié)和展望。在單數(shù)據(jù)流環(huán)境里,增量式學習和集成學習是兩種典型的學習方法;在分布式數(shù)據(jù)流環(huán)境里,集中式挖掘和分布式挖掘是兩種典型的架構(gòu),各具優(yōu)勢。
關(guān)鍵字:數(shù)據(jù)挖掘,單數(shù)據(jù)流,分布式數(shù)據(jù)流,Weka
Abstract
With the development of science and technology, as well as the progress of the economics, there are a lot of data in different areas, which contain large amount of information. However, how to handle these data and derive useful information today is such a major challenge of Computer Science. Data mining technology is becoming an important topic in current research. In recent years, the mining of single data stream has been studied extensively and many valuable models and algorithms emerged. But, with the popularity of internet applications, the application of a single data stream towards the inevitable multi-node transfer of distributed data flow direction and has a wide range of applications. This topic describes the current international and distributed on a single data stream of data stream mining Research Classification Algorithm, In accordance with the method of learning algorithms, to compare and to summarized the various classification algorithm, at the same time classification and current problems faced by a summary of trends and prospects. In a single data stream environment, Incremental learning and integrated learning are two typical learning. In a distributed environment where data flow, centralized mining and mining are two typical distributed architecture, they have different advantage.
Keywords: Data Mining ,Single data stream, Distributed data streams, Weka
目 錄
摘 要 1
Abstract 2
第1章 緒 論 4
1.1本文工作的來源 4
1.2目的和意義 5
1.3國內(nèi)外進展 5
1.4本文工作的主要內(nèi)容 5
第二章 數(shù)據(jù)流的概述 7
2..1數(shù)據(jù)流管理系統(tǒng)的研究 8
2.2數(shù)據(jù)流在不同領(lǐng)域的應用 9
2.2.1在電信數(shù)據(jù)處理方面 9
2.2.2在軍事作戰(zhàn)環(huán)境中 9
2.2.3在科學計算領(lǐng)域方面 10
2.3數(shù)據(jù)流的特點 10
2.4數(shù)據(jù)流挖掘框架 11
2.5本章總結(jié) 12
第三章 單數(shù)據(jù)流分類方法研究 13
3.1傳統(tǒng)的分類方法 13
3.2數(shù)據(jù)流分類技術(shù) 15
3.2.1增量式(incremental)算法。 15
3.2.2集合分類器 17
3.3本章總結(jié) 19
第四章 分布式數(shù)據(jù)流分類方法研究 20
4.1分布式數(shù)據(jù)流的定義 20
4.2分布式數(shù)據(jù)流挖掘面臨的挑戰(zhàn) 21
4.3分布式數(shù)據(jù)流相關(guān)系數(shù)計算 22
4.4基于SPRINT的VHDDS分類方法 23
4.4.1 SPRINT算法簡介 23
4.4.2 VHDDS分類算法 23
4.4.3算法過程 24
4.5本章總結(jié) 28
第五章 分析數(shù)據(jù)挖掘工具 29
5.1Weka背景 29
5.2Weka功能 29
5.3Weka的輸入 30
5.4Weka的輸出 31
5.5Weka的可視化 32
5.6本章總結(jié) 32
參考文獻 33
致 謝 35
外文科技資料翻譯 36
英文原文 36
中文譯文 41
摘 要
隨著科學技術(shù)的發(fā)展,社會經(jīng)濟不斷進步,在社會生產(chǎn)的各個領(lǐng)域中都產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)中蘊含著大量的豐富的信息。但是,如何處理這些數(shù)據(jù)并從中得到有用的信息,是對當今計算機科學研究的一項重大的挑戰(zhàn)。數(shù)據(jù)挖掘技術(shù)成為了當前研究的一項重要的課題。近年來,單數(shù)據(jù)流的挖掘得到了廣泛的研究,提出了許多有價值的模型和算法。但是,隨著網(wǎng)絡環(huán)境應用的普及,單一數(shù)據(jù)流的應用必然向著多節(jié)點的分布式數(shù)據(jù)流方向轉(zhuǎn)移,并有著廣泛的應用前景。本課題闡述了當前國際上關(guān)于單數(shù)據(jù)流和分布式數(shù)據(jù)流挖掘分類算法的研究現(xiàn)狀,按照算法學習模式的方法,對各種分類算法進行比較、歸納,同時,對分類技術(shù)當前所面臨的問題和發(fā)展趨勢進行了總結(jié)和展望。在單數(shù)據(jù)流環(huán)境里,增量式學習和集成學習是兩種典型的學習方法;在分布式數(shù)據(jù)流環(huán)境里,集中式挖掘和分布式挖掘是兩種典型的架構(gòu),各具優(yōu)勢。
關(guān)鍵字:數(shù)據(jù)挖掘,單數(shù)據(jù)流,分布式數(shù)據(jù)流,Weka
Abstract
With the development of science and technology, as well as the progress of the economics, there are a lot of data in different areas, which contain large amount of information. However, how to handle these data and derive useful information today is such a major challenge of Computer Science. Data mining technology is becoming an important topic in current research. In recent years, the mining of single data stream has been studied extensively and many valuable models and algorithms emerged. But, with the popularity of internet applications, the application of a single data stream towards the inevitable multi-node transfer of distributed data flow direction and has a wide range of applications. This topic describes the current international and distributed on a single data stream of data stream mining Research Classification Algorithm, In accordance with the method of learning algorithms, to compare and to summarized the various classification algorithm, at the same time classification and current problems faced by a summary of trends and prospects. In a single data stream environment, Incremental learning and integrated learning are two typical learning. In a distributed environment where data flow, centralized mining and mining are two typical distributed architecture, they have different advantage.
Keywords: Data Mining ,Single data stream, Distributed data streams, Weka
目 錄
摘 要 1
Abstract 2
第1章 緒 論 4
1.1本文工作的來源 4
1.2目的和意義 5
1.3國內(nèi)外進展 5
1.4本文工作的主要內(nèi)容 5
第二章 數(shù)據(jù)流的概述 7
2..1數(shù)據(jù)流管理系統(tǒng)的研究 8
2.2數(shù)據(jù)流在不同領(lǐng)域的應用 9
2.2.1在電信數(shù)據(jù)處理方面 9
2.2.2在軍事作戰(zhàn)環(huán)境中 9
2.2.3在科學計算領(lǐng)域方面 10
2.3數(shù)據(jù)流的特點 10
2.4數(shù)據(jù)流挖掘框架 11
2.5本章總結(jié) 12
第三章 單數(shù)據(jù)流分類方法研究 13
3.1傳統(tǒng)的分類方法 13
3.2數(shù)據(jù)流分類技術(shù) 15
3.2.1增量式(incremental)算法。 15
3.2.2集合分類器 17
3.3本章總結(jié) 19
第四章 分布式數(shù)據(jù)流分類方法研究 20
4.1分布式數(shù)據(jù)流的定義 20
4.2分布式數(shù)據(jù)流挖掘面臨的挑戰(zhàn) 21
4.3分布式數(shù)據(jù)流相關(guān)系數(shù)計算 22
4.4基于SPRINT的VHDDS分類方法 23
4.4.1 SPRINT算法簡介 23
4.4.2 VHDDS分類算法 23
4.4.3算法過程 24
4.5本章總結(jié) 28
第五章 分析數(shù)據(jù)挖掘工具 29
5.1Weka背景 29
5.2Weka功能 29
5.3Weka的輸入 30
5.4Weka的輸出 31
5.5Weka的可視化 32
5.6本章總結(jié) 32
參考文獻 33
致 謝 35
外文科技資料翻譯 36
英文原文 36
中文譯文 41