基于spider技術(shù)的搜索引擎的實(shí)現(xiàn).doc
約6頁DOC格式手機(jī)打開展開
基于spider技術(shù)的搜索引擎的實(shí)現(xiàn),基于spider技術(shù)的搜索引擎的實(shí)現(xiàn)頁數(shù):5字?jǐn)?shù):4112【內(nèi)容提要】本文介紹了基于spider技術(shù)的搜索引擎的核心實(shí)現(xiàn)--內(nèi)容分析與查詢。該核心采用了相關(guān)的信息處理和人工智能技術(shù),提出了逐詞掃描最大匹配法對(duì)網(wǎng)頁內(nèi)容進(jìn)行切詞處理,以及以用戶“點(diǎn)擊率”的觀點(diǎn)對(duì)網(wǎng)頁進(jìn)行排名,從而解決了查詢速度慢和準(zhǔn)確度低的實(shí)際問題,滿足了...
![](http://img.queshao.com/images/pcgzh.gif)
![](http://preview.queshao.com/tobuy/62707.gif)
內(nèi)容介紹
此文檔由會(huì)員 cnlula 發(fā)布
基于SPIDER技術(shù)的搜索引擎的實(shí)現(xiàn)
頁數(shù):5 字?jǐn)?shù):4112
【內(nèi)容提要】本文介紹了基于SPIDER技術(shù)的搜索引擎的核心實(shí)現(xiàn)--內(nèi)容分析與查詢。該核心采用了相關(guān)的信息處理和人工智能技術(shù),提出了逐詞掃描最大匹配法對(duì)網(wǎng)頁內(nèi)容進(jìn)行切詞處理,以及以用戶“點(diǎn)擊率”的觀點(diǎn)對(duì)網(wǎng)頁進(jìn)行排名,從而解決了查詢速度慢和準(zhǔn)確度低的實(shí)際問題,滿足了用戶對(duì)搜索引擎又快又準(zhǔn)的迫切要求。
【關(guān)鍵詞】SPIDER技術(shù)、搜索引擎、逐詞掃描最大匹配法、點(diǎn)擊率
ABSTRACT: This thesis describes the implementation of the hard core of SPIDER Search Engine, Content Analysis and Query. The System uses a new Mathing method called Word By Word Maximum Mathing method to divide a passage into phrases, and uses the “Hit Rate” which comes from the users to arrange the WebPages.Thus it can make the query more
頁數(shù):5 字?jǐn)?shù):4112
【內(nèi)容提要】本文介紹了基于SPIDER技術(shù)的搜索引擎的核心實(shí)現(xiàn)--內(nèi)容分析與查詢。該核心采用了相關(guān)的信息處理和人工智能技術(shù),提出了逐詞掃描最大匹配法對(duì)網(wǎng)頁內(nèi)容進(jìn)行切詞處理,以及以用戶“點(diǎn)擊率”的觀點(diǎn)對(duì)網(wǎng)頁進(jìn)行排名,從而解決了查詢速度慢和準(zhǔn)確度低的實(shí)際問題,滿足了用戶對(duì)搜索引擎又快又準(zhǔn)的迫切要求。
【關(guān)鍵詞】SPIDER技術(shù)、搜索引擎、逐詞掃描最大匹配法、點(diǎn)擊率
ABSTRACT: This thesis describes the implementation of the hard core of SPIDER Search Engine, Content Analysis and Query. The System uses a new Mathing method called Word By Word Maximum Mathing method to divide a passage into phrases, and uses the “Hit Rate” which comes from the users to arrange the WebPages.Thus it can make the query more