基于spider技術(shù)的搜索引擎的實現(xiàn).doc
約6頁DOC格式手機打開展開
基于spider技術(shù)的搜索引擎的實現(xiàn),基于spider技術(shù)的搜索引擎的實現(xiàn)頁數(shù):5字數(shù):4112【內(nèi)容提要】本文介紹了基于spider技術(shù)的搜索引擎的核心實現(xiàn)--內(nèi)容分析與查詢。該核心采用了相關(guān)的信息處理和人工智能技術(shù),提出了逐詞掃描最大匹配法對網(wǎng)頁內(nèi)容進行切詞處理,以及以用戶“點擊率”的觀點對網(wǎng)頁進行排名,從而解決了查詢速度慢和準確度低的實際問題,滿足了...


內(nèi)容介紹
此文檔由會員 cnlula 發(fā)布
基于SPIDER技術(shù)的搜索引擎的實現(xiàn)
頁數(shù):5 字數(shù):4112
【內(nèi)容提要】本文介紹了基于SPIDER技術(shù)的搜索引擎的核心實現(xiàn)--內(nèi)容分析與查詢。該核心采用了相關(guān)的信息處理和人工智能技術(shù),提出了逐詞掃描最大匹配法對網(wǎng)頁內(nèi)容進行切詞處理,以及以用戶“點擊率”的觀點對網(wǎng)頁進行排名,從而解決了查詢速度慢和準確度低的實際問題,滿足了用戶對搜索引擎又快又準的迫切要求。
【關(guān)鍵詞】SPIDER技術(shù)、搜索引擎、逐詞掃描最大匹配法、點擊率
ABSTRACT: This thesis describes the implementation of the hard core of SPIDER Search Engine, Content Analysis and Query. The System uses a new Mathing method called Word By Word Maximum Mathing method to divide a passage into phrases, and uses the “Hit Rate” which comes from the users to arrange the WebPages.Thus it can make the query more
頁數(shù):5 字數(shù):4112
【內(nèi)容提要】本文介紹了基于SPIDER技術(shù)的搜索引擎的核心實現(xiàn)--內(nèi)容分析與查詢。該核心采用了相關(guān)的信息處理和人工智能技術(shù),提出了逐詞掃描最大匹配法對網(wǎng)頁內(nèi)容進行切詞處理,以及以用戶“點擊率”的觀點對網(wǎng)頁進行排名,從而解決了查詢速度慢和準確度低的實際問題,滿足了用戶對搜索引擎又快又準的迫切要求。
【關(guān)鍵詞】SPIDER技術(shù)、搜索引擎、逐詞掃描最大匹配法、點擊率
ABSTRACT: This thesis describes the implementation of the hard core of SPIDER Search Engine, Content Analysis and Query. The System uses a new Mathing method called Word By Word Maximum Mathing method to divide a passage into phrases, and uses the “Hit Rate” which comes from the users to arrange the WebPages.Thus it can make the query more