国产精品婷婷久久久久久,国产精品美女久久久浪潮av,草草国产,人妻精品久久无码专区精东影业

數(shù)據(jù)挖掘算法研究與實(shí)現(xiàn).doc

  
約58頁(yè)DOC格式手機(jī)打開(kāi)展開(kāi)

數(shù)據(jù)挖掘算法研究與實(shí)現(xiàn),2.3萬(wàn)字 58頁(yè)包括外文翻譯及代碼,原創(chuàng)作品,通過(guò)查重系統(tǒng)摘要隨著互聯(lián)網(wǎng)的普及以及科技的進(jìn)步,越來(lái)越多新技術(shù)在不斷地涌現(xiàn)出來(lái),云計(jì)算、大數(shù)據(jù)等詞匯開(kāi)始不斷地出現(xiàn)在我們周圍,給我們的生活與學(xué)習(xí)帶來(lái)了巨大的改變。大數(shù)據(jù)這一話題被廣大人群所認(rèn)識(shí)并接受,伴隨智能機(jī)等可移動(dòng)設(shè)備的涌現(xiàn),我們的各種時(shí)間、空間...
編號(hào):99-583735大小:795.00K
分類: 論文>計(jì)算機(jī)論文

內(nèi)容介紹

此文檔由會(huì)員 第二波打卡 發(fā)布

數(shù)據(jù)挖掘算法研究與實(shí)現(xiàn)


2.3萬(wàn)字 58頁(yè) 包括外文翻譯及代碼,原創(chuàng)作品,通過(guò)查重系統(tǒng)


摘 要
隨著互聯(lián)網(wǎng)的普及以及科技的進(jìn)步,越來(lái)越多新技術(shù)在不斷地涌現(xiàn)出來(lái),云計(jì)算、大數(shù)據(jù)等詞匯開(kāi)始不斷地出現(xiàn)在我們周圍,給我們的生活與學(xué)習(xí)帶來(lái)了巨大的改變。大數(shù)據(jù)這一話題被廣大人群所認(rèn)識(shí)并接受,伴隨智能機(jī)等可移動(dòng)設(shè)備的涌現(xiàn),我們的各種時(shí)間、空間等信息都轉(zhuǎn)變成了可以被存儲(chǔ)和挖掘的數(shù)據(jù)。如同英國(guó)Viktor Mayer-Schönberger在他的暢銷著作《大數(shù)據(jù)時(shí)代》里所描述的那樣,面對(duì)海量的數(shù)據(jù),我們看到的僅僅只是冰山一角,當(dāng)我們深入其中時(shí),才會(huì)發(fā)現(xiàn)隱藏在冰山下面更廣闊的信息。數(shù)據(jù)挖掘作為發(fā)掘數(shù)據(jù)價(jià)值的驅(qū)動(dòng)力,在這個(gè)海量數(shù)據(jù)的時(shí)代應(yīng)運(yùn)而生。如同一個(gè)問(wèn)題的正反面,數(shù)據(jù)與數(shù)據(jù)挖掘可以看做是問(wèn)題與方法的關(guān)系。通過(guò)對(duì)大數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,得出可靠的規(guī)則與模型,從而為決策作出更加精確的評(píng)判,使數(shù)據(jù)的隱藏價(jià)值得以更好的利用。
數(shù)據(jù)挖掘作為一門正在被廣泛研究與探討的學(xué)科,其許多有價(jià)值的算法被傳承下來(lái),例如在2006年12月被國(guó)際權(quán)威學(xué)術(shù)組織——數(shù)據(jù)挖掘國(guó)際會(huì)議ICDM(the IEEE International Conference on Data Mining)——評(píng)選出的數(shù)據(jù)挖掘領(lǐng)域十大經(jīng)典算法等。本次畢業(yè)設(shè)計(jì)中,我們挖掘的對(duì)象主要是圖像數(shù)據(jù),因此需要對(duì)該種數(shù)據(jù)進(jìn)行處理,從而得到可以用Apriori算法進(jìn)行挖掘的數(shù)據(jù)格式。而對(duì)于圖像數(shù)據(jù)的提取分類等,不在本論文進(jìn)行深入討論,本次畢業(yè)設(shè)計(jì)所使用的圖像數(shù)據(jù)是由相關(guān)研究生學(xué)長(zhǎng)學(xué)姐提供,本論文就十大算法之一的Apriori算法進(jìn)行深入研究并實(shí)現(xiàn)其具體算法,并盡可能用該算法挖掘出所給的圖像數(shù)據(jù)的頻繁項(xiàng)集,從而做出后續(xù)的分析。Apriori算法作為關(guān)聯(lián)規(guī)則頻集挖掘的經(jīng)典算法之一,是一種單層次、單維度、布爾類型的關(guān)聯(lián)規(guī)則挖掘算法,其中,我們把支持度小于用戶所給定支持度的項(xiàng)集叫做非頻繁項(xiàng)集,大于等于用戶給定支持度的項(xiàng)集叫做頻繁項(xiàng)集,即頻集。本文對(duì)已獲得的圖像數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,得出圖像數(shù)據(jù)的頻繁項(xiàng)集,通過(guò)相關(guān)軟件工具LIBSVM進(jìn)行分析,從而得出Apriori算法的挖掘精度,并通過(guò)與另一種圖像數(shù)據(jù)的處理方式,即BoF模型,進(jìn)行比較,得出它們之間在處理圖像數(shù)據(jù)時(shí)精確度的高低,從而為以后其它關(guān)于圖形數(shù)據(jù)挖掘的研究做出參考。



關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法