數(shù)據(jù)挖掘技術(shù)概論.doc
約8頁DOC格式手機打開展開
數(shù)據(jù)挖掘技術(shù)概論,頁數(shù):8字?jǐn)?shù):9004摘要: 本文簡潔的論述了數(shù)據(jù)挖掘產(chǎn)生的時代背景,研究現(xiàn)狀,基本術(shù)語,及目前的應(yīng)用情況關(guān)鍵字:數(shù)據(jù)挖掘,數(shù)據(jù)倉庫,時代背景近十幾年來,人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,無數(shù)個數(shù)據(jù)庫被用于商業(yè)管理、政府辦公、科學(xué)研究和工程開發(fā)等,這一勢頭仍將持續(xù)發(fā)展下去。...


內(nèi)容介紹
此文檔由會員 usactu 發(fā)布
數(shù)據(jù)挖掘技術(shù)概論
頁數(shù):8 字?jǐn)?shù):9004
數(shù)據(jù)挖掘技術(shù)概論
摘要: 本文簡潔的論述了數(shù)據(jù)挖掘產(chǎn)生的時代背景,研究現(xiàn)狀,基本術(shù)語,及目前的應(yīng)用情況
關(guān)鍵字:數(shù)據(jù)挖掘,數(shù)據(jù)倉庫,
時代背景
近十幾年來,人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,無數(shù)個數(shù)據(jù)庫被用于商業(yè)管理、政府辦公、科學(xué)研究和工程開發(fā)等,這一勢頭仍將持續(xù)發(fā)展下去。于是,一個新的挑戰(zhàn)被提了出來:在這被稱之為信息爆炸的時代,信息過量幾乎成為人人需要面對的問題。如何才能不被信息的汪洋大海所淹沒,從中及時發(fā)現(xiàn)有用的知識,提高信息利用率呢要想使數(shù)據(jù)真正成為一個公司的資源,只有充分利用它為公司自身的業(yè)務(wù)決策和戰(zhàn)略發(fā)展服務(wù)才行,否則大量的數(shù)據(jù)可能成為包袱,甚至成為垃圾。因此,面對"人們被數(shù)據(jù)淹沒,人們卻饑餓于知識"的挑戰(zhàn),數(shù)據(jù)挖掘和知識發(fā)現(xiàn)(DMKD)技術(shù)應(yīng)運而生,并得以蓬勃發(fā)展,越來越顯示出其強大的生命力。
傳統(tǒng)的數(shù)據(jù)庫技術(shù)是以單一的數(shù)據(jù)資源,即數(shù)據(jù)庫為中心,進(jìn)行事務(wù)處理、批處理、決策分析等各種數(shù)據(jù)處理工作,主要的劃分為兩大類:操作型處理和分析型處理(或信息型處理)。 操作型處理也叫事務(wù)處理,是指對數(shù)據(jù)庫聯(lián)機的日常操作,通常是對一個或一組紀(jì)錄的查詢和修改,主要為企業(yè)的特定應(yīng)用服務(wù)的,注重響應(yīng)時間,數(shù)據(jù)的安全性和完整性;分析型處理則用于管理人員的決策分析,經(jīng)常要訪問大量的歷史數(shù)據(jù)。而傳統(tǒng)數(shù)據(jù)庫系統(tǒng)優(yōu)于企業(yè)的日常事務(wù)處理工作,而難于實現(xiàn)對數(shù)據(jù)分析處理要求,已經(jīng)無法滿足數(shù)據(jù)處理多樣化的要求。操作型處理和分析型處理的分離成為必然。近年來,隨著數(shù)據(jù)庫技術(shù)的應(yīng)用和發(fā)展,人們嘗試對DB中的數(shù)據(jù)進(jìn)行再加工,形成一個綜合的,面向分析的環(huán)境,以更好支持決策分析,從而形成了數(shù)據(jù)倉庫技術(shù)
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。還有很多和這一術(shù)語相近似的術(shù)語,如從數(shù)據(jù)庫中發(fā)現(xiàn)知識(KDD)、數(shù)據(jù)分析、數(shù)據(jù)融合(Data Fusion)以及決策支持等。人們把原始數(shù)據(jù)看作是形成知識的源泉,就像從礦石中采礦一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,
頁數(shù):8 字?jǐn)?shù):9004
數(shù)據(jù)挖掘技術(shù)概論
摘要: 本文簡潔的論述了數(shù)據(jù)挖掘產(chǎn)生的時代背景,研究現(xiàn)狀,基本術(shù)語,及目前的應(yīng)用情況
關(guān)鍵字:數(shù)據(jù)挖掘,數(shù)據(jù)倉庫,
時代背景
近十幾年來,人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,無數(shù)個數(shù)據(jù)庫被用于商業(yè)管理、政府辦公、科學(xué)研究和工程開發(fā)等,這一勢頭仍將持續(xù)發(fā)展下去。于是,一個新的挑戰(zhàn)被提了出來:在這被稱之為信息爆炸的時代,信息過量幾乎成為人人需要面對的問題。如何才能不被信息的汪洋大海所淹沒,從中及時發(fā)現(xiàn)有用的知識,提高信息利用率呢要想使數(shù)據(jù)真正成為一個公司的資源,只有充分利用它為公司自身的業(yè)務(wù)決策和戰(zhàn)略發(fā)展服務(wù)才行,否則大量的數(shù)據(jù)可能成為包袱,甚至成為垃圾。因此,面對"人們被數(shù)據(jù)淹沒,人們卻饑餓于知識"的挑戰(zhàn),數(shù)據(jù)挖掘和知識發(fā)現(xiàn)(DMKD)技術(shù)應(yīng)運而生,并得以蓬勃發(fā)展,越來越顯示出其強大的生命力。
傳統(tǒng)的數(shù)據(jù)庫技術(shù)是以單一的數(shù)據(jù)資源,即數(shù)據(jù)庫為中心,進(jìn)行事務(wù)處理、批處理、決策分析等各種數(shù)據(jù)處理工作,主要的劃分為兩大類:操作型處理和分析型處理(或信息型處理)。 操作型處理也叫事務(wù)處理,是指對數(shù)據(jù)庫聯(lián)機的日常操作,通常是對一個或一組紀(jì)錄的查詢和修改,主要為企業(yè)的特定應(yīng)用服務(wù)的,注重響應(yīng)時間,數(shù)據(jù)的安全性和完整性;分析型處理則用于管理人員的決策分析,經(jīng)常要訪問大量的歷史數(shù)據(jù)。而傳統(tǒng)數(shù)據(jù)庫系統(tǒng)優(yōu)于企業(yè)的日常事務(wù)處理工作,而難于實現(xiàn)對數(shù)據(jù)分析處理要求,已經(jīng)無法滿足數(shù)據(jù)處理多樣化的要求。操作型處理和分析型處理的分離成為必然。近年來,隨著數(shù)據(jù)庫技術(shù)的應(yīng)用和發(fā)展,人們嘗試對DB中的數(shù)據(jù)進(jìn)行再加工,形成一個綜合的,面向分析的環(huán)境,以更好支持決策分析,從而形成了數(shù)據(jù)倉庫技術(shù)
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。還有很多和這一術(shù)語相近似的術(shù)語,如從數(shù)據(jù)庫中發(fā)現(xiàn)知識(KDD)、數(shù)據(jù)分析、數(shù)據(jù)融合(Data Fusion)以及決策支持等。人們把原始數(shù)據(jù)看作是形成知識的源泉,就像從礦石中采礦一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,
TA們正在看...
- 一個優(yōu)秀班主任的工作總結(jié).doc
- 一季銷售工作總結(jié)字模板.doc
- 一年級小學(xué)班主任數(shù)學(xué)教學(xué)工作總結(jié).doc
- 一年級數(shù)學(xué)教師個人工作總結(jié)三篇.doc
- 一年級體育教學(xué)工作總結(jié)優(yōu)秀范文.doc
- 一年級數(shù)學(xué)教學(xué)工作總結(jié)【三篇】.doc
- 一年級數(shù)學(xué)教師工作總結(jié)三篇.doc
- 一年級班主任工作總結(jié)1000字.doc
- 一年級班主任個人工作總結(jié)三篇.doc
- 一年級班主任學(xué)期工作個人總結(jié)三篇.doc