搜索引擎設(shè)計.doc
約28頁DOC格式手機(jī)打開展開
搜索引擎設(shè)計,1.8萬字28頁摘要搜索引擎按其工作方式主要可分為三種,分別是全文搜索引擎(full text search engine)、目錄索引類搜索引擎(search index/directory)和元搜索引擎(meta search engine)。全文搜索引擎是最廣泛也是用得最多的一種,一般所說的搜索引擎都指的是全文搜索...
內(nèi)容介紹
此文檔由會員 王蕓 發(fā)布
1.8萬字 28頁
摘要
搜索引擎按其工作方式主要可分為三種,分別是全文搜索引擎(Full Text Search Engine)、目錄索引類搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。全文搜索引擎是最廣泛也是用得最多的一種,一般所說的搜索引擎都指的是全文搜索引擎。
針對當(dāng)前搜索引擎的系統(tǒng)結(jié)構(gòu),在對目前大部分搜索引擎技術(shù)研究的基礎(chǔ)上,綜合其設(shè)計思路,給出了一個新的信息檢索系統(tǒng)的框架原型,它比現(xiàn)有搜索引擎更加優(yōu)化,是一種新的搜索引擎結(jié)構(gòu),也就是對網(wǎng)頁中的信息處理問題提取進(jìn)行了研究。根據(jù)HTLM的規(guī)則,對其進(jìn)行部分的提取,然后把其導(dǎo)入數(shù)據(jù)庫,從而能夠?qū)π畔⒄_、快速的提取。提取運用的是正則表達(dá)式,盡管最初的正則表達(dá)式出現(xiàn)于理論計算機(jī)科學(xué)的自動控制理論和形式語言理論中。在這些領(lǐng)域中有對計算(自動控制)的模型和對形式語言描述與分類的研究?,F(xiàn)在它能廣泛的使用在很多領(lǐng)域,所以本次研究就是要運用正則表達(dá)式來完成項目的開發(fā)。
目錄
前言
第一章 緒論
第二章 搜索引擎的概況與分析
2.1搜索引擎分類
2.1.1全文搜索引擎
2.1.2目錄索引
2.1.3元搜索引擎
2.2搜索引擎的結(jié)構(gòu)
2.2.1 Robot爬行程序
2.2.2索引模塊
2.2.3 搜索模塊
2.3垂直搜索引擎技術(shù)
2.3.1垂直搜索引擎
2.3.2 垂直搜索的劃分
2.3.3垂直搜索引擎的相關(guān)技術(shù)
2.4小結(jié)
第三章 正則表達(dá)式
第四章 系統(tǒng)的設(shè)計與開發(fā)
4.1 系統(tǒng)概述
4.2 有向ROBOT
4.2.1搜索Robot
4.2.2挖掘Robot
4.2.3收集Robot
4.3索引器
4.4 網(wǎng)頁的分析提取
4.4.1網(wǎng)頁內(nèi)容的提取
4.4.2網(wǎng)頁分析
4.5 數(shù)據(jù)表
4.6 交互界面
4.7 小結(jié)
結(jié)束語
參考文獻(xiàn)
致謝
摘要
搜索引擎按其工作方式主要可分為三種,分別是全文搜索引擎(Full Text Search Engine)、目錄索引類搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。全文搜索引擎是最廣泛也是用得最多的一種,一般所說的搜索引擎都指的是全文搜索引擎。
針對當(dāng)前搜索引擎的系統(tǒng)結(jié)構(gòu),在對目前大部分搜索引擎技術(shù)研究的基礎(chǔ)上,綜合其設(shè)計思路,給出了一個新的信息檢索系統(tǒng)的框架原型,它比現(xiàn)有搜索引擎更加優(yōu)化,是一種新的搜索引擎結(jié)構(gòu),也就是對網(wǎng)頁中的信息處理問題提取進(jìn)行了研究。根據(jù)HTLM的規(guī)則,對其進(jìn)行部分的提取,然后把其導(dǎo)入數(shù)據(jù)庫,從而能夠?qū)π畔⒄_、快速的提取。提取運用的是正則表達(dá)式,盡管最初的正則表達(dá)式出現(xiàn)于理論計算機(jī)科學(xué)的自動控制理論和形式語言理論中。在這些領(lǐng)域中有對計算(自動控制)的模型和對形式語言描述與分類的研究?,F(xiàn)在它能廣泛的使用在很多領(lǐng)域,所以本次研究就是要運用正則表達(dá)式來完成項目的開發(fā)。
目錄
前言
第一章 緒論
第二章 搜索引擎的概況與分析
2.1搜索引擎分類
2.1.1全文搜索引擎
2.1.2目錄索引
2.1.3元搜索引擎
2.2搜索引擎的結(jié)構(gòu)
2.2.1 Robot爬行程序
2.2.2索引模塊
2.2.3 搜索模塊
2.3垂直搜索引擎技術(shù)
2.3.1垂直搜索引擎
2.3.2 垂直搜索的劃分
2.3.3垂直搜索引擎的相關(guān)技術(shù)
2.4小結(jié)
第三章 正則表達(dá)式
第四章 系統(tǒng)的設(shè)計與開發(fā)
4.1 系統(tǒng)概述
4.2 有向ROBOT
4.2.1搜索Robot
4.2.2挖掘Robot
4.2.3收集Robot
4.3索引器
4.4 網(wǎng)頁的分析提取
4.4.1網(wǎng)頁內(nèi)容的提取
4.4.2網(wǎng)頁分析
4.5 數(shù)據(jù)表
4.6 交互界面
4.7 小結(jié)
結(jié)束語
參考文獻(xiàn)
致謝