基于向量空間模型的internet信息檢索.doc
約25頁(yè)DOC格式手機(jī)打開(kāi)展開(kāi)
基于向量空間模型的internet信息檢索,基于向量空間模型的internet信息檢索頁(yè)數(shù) 27 字?jǐn)?shù) 8596摘要隨著萬(wàn)維網(wǎng)(www)上的信息以指數(shù)級(jí)的增長(zhǎng),它已成為世界上最大的以及增長(zhǎng)最快的信息資源所在。在www上使用的用戶不難發(fā)現(xiàn),通常他們所需要的信息被淹沒(méi)在這巨大的信息量中。信息檢索已經(jīng)成為人們獲取有用信息不可缺少的工具。布爾模型檢索雖然具有簡(jiǎn)單、速度快...


內(nèi)容介紹
此文檔由會(huì)員 趙亮 發(fā)布
基于向量空間模型的INTERNET信息檢索
頁(yè)數(shù) 27 字?jǐn)?shù) 8596
摘 要
隨著萬(wàn)維網(wǎng)(WWW)上的信息以指數(shù)級(jí)的增長(zhǎng),它已成為世界上最大的以及增長(zhǎng)最快的信息資源所在。在WWW上使用的用戶不難發(fā)現(xiàn),通常他們所需要的信息被淹沒(méi)在這巨大的信息量中。信息檢索已經(jīng)成為人們獲取有用信息不可缺少的工具。布爾模型檢索雖然具有簡(jiǎn)單、速度快和查詢表達(dá)式易于掌握等優(yōu)點(diǎn),但因其不夠精確,不能反映不同特征詞對(duì)一個(gè)文檔的重要程度,且檢索結(jié)果地位平等,無(wú)法進(jìn)行有效的排序。在向量空間模型檢索中,文檔和查詢都是使用向量來(lái)表示,檢索過(guò)程即計(jì)算文檔響亮和查詢向量之間的相似度,可以根據(jù)相似度的不同,對(duì)查詢結(jié)果進(jìn)行排序,還可以根據(jù)檢索結(jié)果,進(jìn)一步做出相關(guān)檢索(relevance feedback)。文章通過(guò)使用向量空間模型作為檢索模型,實(shí)現(xiàn)一個(gè)簡(jiǎn)單的檢索系統(tǒng)。
關(guān)鍵詞:向量空間模型,信息檢索,檢索模型
Abstract
With the amount of information growing at an exponential rate, the World Wide Web (WWW) is often referred to as the world’s largest and fastest growing information source. It is not uncommon that the users on WWW often find themselves overwhelmed with the large amount of information that might be of their interest and usefulness. Information Retrieval turns more and more important for the users to get useful information. The retrieval model using Boolean Model has some advantages such as simple, quickly and easy to query, but, it can’t reflect the term’s significance to the document and the results can’t be sorted. In Vector Space Model, documents and queries are represented by an n-dimensional vector, The retrieval process is to calculated the similarity between document vector and query vector. The result can be sorted by similarity and do relevance feedback. In this paper, a simple retrieval system using Vector Space Model is actualized.
Keywords: Vector Space Model; Information retrieval; Retrieval Model.
目 錄
1 引言…………………………………………………………………………(4)
2 信息檢索模型………………………………………………………………(4)
2.1 布爾模型 …………………………………………………………………(4)
2.2 向量空間模型 ……………………………………………………………(5)
3 檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)……………………………………………………(8)
3.1 信息檢索結(jié)構(gòu) ……………………………………………………………(8)
3.2 文檔的獲取與存儲(chǔ) ………………………………………………………(9)
3.3 文檔的特征提取與表示 …………………………………………………(10)
3.4 搜索實(shí)現(xiàn) …………………………………………………………………(12)
3.5 結(jié)果與分析 ………………………………………………………………(13)
4 結(jié)束語(yǔ)………………………………………………………………………(14)
致謝………………………………………………………………………………(14)
參考文獻(xiàn)…………………………………………………………………………(14)
附錄一……………………………………………………………………………(16)
附錄二……………………………………………………………………………(18)
附錄三……………………………………………………………………………(21)
頁(yè)數(shù) 27 字?jǐn)?shù) 8596
摘 要
隨著萬(wàn)維網(wǎng)(WWW)上的信息以指數(shù)級(jí)的增長(zhǎng),它已成為世界上最大的以及增長(zhǎng)最快的信息資源所在。在WWW上使用的用戶不難發(fā)現(xiàn),通常他們所需要的信息被淹沒(méi)在這巨大的信息量中。信息檢索已經(jīng)成為人們獲取有用信息不可缺少的工具。布爾模型檢索雖然具有簡(jiǎn)單、速度快和查詢表達(dá)式易于掌握等優(yōu)點(diǎn),但因其不夠精確,不能反映不同特征詞對(duì)一個(gè)文檔的重要程度,且檢索結(jié)果地位平等,無(wú)法進(jìn)行有效的排序。在向量空間模型檢索中,文檔和查詢都是使用向量來(lái)表示,檢索過(guò)程即計(jì)算文檔響亮和查詢向量之間的相似度,可以根據(jù)相似度的不同,對(duì)查詢結(jié)果進(jìn)行排序,還可以根據(jù)檢索結(jié)果,進(jìn)一步做出相關(guān)檢索(relevance feedback)。文章通過(guò)使用向量空間模型作為檢索模型,實(shí)現(xiàn)一個(gè)簡(jiǎn)單的檢索系統(tǒng)。
關(guān)鍵詞:向量空間模型,信息檢索,檢索模型
Abstract
With the amount of information growing at an exponential rate, the World Wide Web (WWW) is often referred to as the world’s largest and fastest growing information source. It is not uncommon that the users on WWW often find themselves overwhelmed with the large amount of information that might be of their interest and usefulness. Information Retrieval turns more and more important for the users to get useful information. The retrieval model using Boolean Model has some advantages such as simple, quickly and easy to query, but, it can’t reflect the term’s significance to the document and the results can’t be sorted. In Vector Space Model, documents and queries are represented by an n-dimensional vector, The retrieval process is to calculated the similarity between document vector and query vector. The result can be sorted by similarity and do relevance feedback. In this paper, a simple retrieval system using Vector Space Model is actualized.
Keywords: Vector Space Model; Information retrieval; Retrieval Model.
目 錄
1 引言…………………………………………………………………………(4)
2 信息檢索模型………………………………………………………………(4)
2.1 布爾模型 …………………………………………………………………(4)
2.2 向量空間模型 ……………………………………………………………(5)
3 檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)……………………………………………………(8)
3.1 信息檢索結(jié)構(gòu) ……………………………………………………………(8)
3.2 文檔的獲取與存儲(chǔ) ………………………………………………………(9)
3.3 文檔的特征提取與表示 …………………………………………………(10)
3.4 搜索實(shí)現(xiàn) …………………………………………………………………(12)
3.5 結(jié)果與分析 ………………………………………………………………(13)
4 結(jié)束語(yǔ)………………………………………………………………………(14)
致謝………………………………………………………………………………(14)
參考文獻(xiàn)…………………………………………………………………………(14)
附錄一……………………………………………………………………………(16)
附錄二……………………………………………………………………………(18)
附錄三……………………………………………………………………………(21)
TA們正在看...
- 氣相色譜法測(cè)定牙膏中的二甘醇含量.doc
- 加油站管理規(guī)范(操作部分).rar
- 珠江流域綜合規(guī)劃測(cè)量.doc
- asp網(wǎng)上書(shū)城系統(tǒng)畢業(yè)論文.rar
- 智能溫室控制系統(tǒng)的設(shè)計(jì).doc
- 高中人教a版數(shù)學(xué)教案.rar
- 班主任評(píng)語(yǔ)模板.doc
- 制藥企業(yè)員工滿意度、組織承諾與離職意愿相關(guān)性實(shí)...doc
- 深圳市深信服電子科技有限公司集成創(chuàng)新實(shí)證研究.doc
- s2sh網(wǎng)上書(shū)店系統(tǒng)(mysql5+tomcat5.5/6).rar