數(shù)據(jù)挖掘算法研究與實現(xiàn).doc
約58頁DOC格式手機打開展開
數(shù)據(jù)挖掘算法研究與實現(xiàn),2.3萬字 58頁包括外文翻譯及代碼,原創(chuàng)作品,通過查重系統(tǒng)摘要隨著互聯(lián)網(wǎng)的普及以及科技的進步,越來越多新技術(shù)在不斷地涌現(xiàn)出來,云計算、大數(shù)據(jù)等詞匯開始不斷地出現(xiàn)在我們周圍,給我們的生活與學(xué)習(xí)帶來了巨大的改變。大數(shù)據(jù)這一話題被廣大人群所認識并接受,伴隨智能機等可移動設(shè)備的涌現(xiàn),我們的各種時間、空間...
內(nèi)容介紹
此文檔由會員 第二波打卡 發(fā)布
數(shù)據(jù)挖掘算法研究與實現(xiàn)
2.3萬字 58頁 包括外文翻譯及代碼,原創(chuàng)作品,通過查重系統(tǒng)
摘 要
隨著互聯(lián)網(wǎng)的普及以及科技的進步,越來越多新技術(shù)在不斷地涌現(xiàn)出來,云計算、大數(shù)據(jù)等詞匯開始不斷地出現(xiàn)在我們周圍,給我們的生活與學(xué)習(xí)帶來了巨大的改變。大數(shù)據(jù)這一話題被廣大人群所認識并接受,伴隨智能機等可移動設(shè)備的涌現(xiàn),我們的各種時間、空間等信息都轉(zhuǎn)變成了可以被存儲和挖掘的數(shù)據(jù)。如同英國Viktor Mayer-Schönberger在他的暢銷著作《大數(shù)據(jù)時代》里所描述的那樣,面對海量的數(shù)據(jù),我們看到的僅僅只是冰山一角,當(dāng)我們深入其中時,才會發(fā)現(xiàn)隱藏在冰山下面更廣闊的信息。數(shù)據(jù)挖掘作為發(fā)掘數(shù)據(jù)價值的驅(qū)動力,在這個海量數(shù)據(jù)的時代應(yīng)運而生。如同一個問題的正反面,數(shù)據(jù)與數(shù)據(jù)挖掘可以看做是問題與方法的關(guān)系。通過對大數(shù)據(jù)進行數(shù)據(jù)挖掘,得出可靠的規(guī)則與模型,從而為決策作出更加精確的評判,使數(shù)據(jù)的隱藏價值得以更好的利用。
數(shù)據(jù)挖掘作為一門正在被廣泛研究與探討的學(xué)科,其許多有價值的算法被傳承下來,例如在2006年12月被國際權(quán)威學(xué)術(shù)組織——數(shù)據(jù)挖掘國際會議ICDM(the IEEE International Conference on Data Mining)——評選出的數(shù)據(jù)挖掘領(lǐng)域十大經(jīng)典算法等。本次畢業(yè)設(shè)計中,我們挖掘的對象主要是圖像數(shù)據(jù),因此需要對該種數(shù)據(jù)進行處理,從而得到可以用Apriori算法進行挖掘的數(shù)據(jù)格式。而對于圖像數(shù)據(jù)的提取分類等,不在本論文進行深入討論,本次畢業(yè)設(shè)計所使用的圖像數(shù)據(jù)是由相關(guān)研究生學(xué)長學(xué)姐提供,本論文就十大算法之一的Apriori算法進行深入研究并實現(xiàn)其具體算法,并盡可能用該算法挖掘出所給的圖像數(shù)據(jù)的頻繁項集,從而做出后續(xù)的分析。Apriori算法作為關(guān)聯(lián)規(guī)則頻集挖掘的經(jīng)典算法之一,是一種單層次、單維度、布爾類型的關(guān)聯(lián)規(guī)則挖掘算法,其中,我們把支持度小于用戶所給定支持度的項集叫做非頻繁項集,大于等于用戶給定支持度的項集叫做頻繁項集,即頻集。本文對已獲得的圖像數(shù)據(jù)進行數(shù)據(jù)挖掘,得出圖像數(shù)據(jù)的頻繁項集,通過相關(guān)軟件工具LIBSVM進行分析,從而得出Apriori算法的挖掘精度,并通過與另一種圖像數(shù)據(jù)的處理方式,即BoF模型,進行比較,得出它們之間在處理圖像數(shù)據(jù)時精確度的高低,從而為以后其它關(guān)于圖形數(shù)據(jù)挖掘的研究做出參考。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法
2.3萬字 58頁 包括外文翻譯及代碼,原創(chuàng)作品,通過查重系統(tǒng)
摘 要
隨著互聯(lián)網(wǎng)的普及以及科技的進步,越來越多新技術(shù)在不斷地涌現(xiàn)出來,云計算、大數(shù)據(jù)等詞匯開始不斷地出現(xiàn)在我們周圍,給我們的生活與學(xué)習(xí)帶來了巨大的改變。大數(shù)據(jù)這一話題被廣大人群所認識并接受,伴隨智能機等可移動設(shè)備的涌現(xiàn),我們的各種時間、空間等信息都轉(zhuǎn)變成了可以被存儲和挖掘的數(shù)據(jù)。如同英國Viktor Mayer-Schönberger在他的暢銷著作《大數(shù)據(jù)時代》里所描述的那樣,面對海量的數(shù)據(jù),我們看到的僅僅只是冰山一角,當(dāng)我們深入其中時,才會發(fā)現(xiàn)隱藏在冰山下面更廣闊的信息。數(shù)據(jù)挖掘作為發(fā)掘數(shù)據(jù)價值的驅(qū)動力,在這個海量數(shù)據(jù)的時代應(yīng)運而生。如同一個問題的正反面,數(shù)據(jù)與數(shù)據(jù)挖掘可以看做是問題與方法的關(guān)系。通過對大數(shù)據(jù)進行數(shù)據(jù)挖掘,得出可靠的規(guī)則與模型,從而為決策作出更加精確的評判,使數(shù)據(jù)的隱藏價值得以更好的利用。
數(shù)據(jù)挖掘作為一門正在被廣泛研究與探討的學(xué)科,其許多有價值的算法被傳承下來,例如在2006年12月被國際權(quán)威學(xué)術(shù)組織——數(shù)據(jù)挖掘國際會議ICDM(the IEEE International Conference on Data Mining)——評選出的數(shù)據(jù)挖掘領(lǐng)域十大經(jīng)典算法等。本次畢業(yè)設(shè)計中,我們挖掘的對象主要是圖像數(shù)據(jù),因此需要對該種數(shù)據(jù)進行處理,從而得到可以用Apriori算法進行挖掘的數(shù)據(jù)格式。而對于圖像數(shù)據(jù)的提取分類等,不在本論文進行深入討論,本次畢業(yè)設(shè)計所使用的圖像數(shù)據(jù)是由相關(guān)研究生學(xué)長學(xué)姐提供,本論文就十大算法之一的Apriori算法進行深入研究并實現(xiàn)其具體算法,并盡可能用該算法挖掘出所給的圖像數(shù)據(jù)的頻繁項集,從而做出后續(xù)的分析。Apriori算法作為關(guān)聯(lián)規(guī)則頻集挖掘的經(jīng)典算法之一,是一種單層次、單維度、布爾類型的關(guān)聯(lián)規(guī)則挖掘算法,其中,我們把支持度小于用戶所給定支持度的項集叫做非頻繁項集,大于等于用戶給定支持度的項集叫做頻繁項集,即頻集。本文對已獲得的圖像數(shù)據(jù)進行數(shù)據(jù)挖掘,得出圖像數(shù)據(jù)的頻繁項集,通過相關(guān)軟件工具LIBSVM進行分析,從而得出Apriori算法的挖掘精度,并通過與另一種圖像數(shù)據(jù)的處理方式,即BoF模型,進行比較,得出它們之間在處理圖像數(shù)據(jù)時精確度的高低,從而為以后其它關(guān)于圖形數(shù)據(jù)挖掘的研究做出參考。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法