聚焦爬蟲設(shè)計(jì)與實(shí)現(xiàn).doc
![](http:///template/default/images/docicon2.gif)
![](http:///template/default/images/docicon4.gif)
約64頁DOC格式手機(jī)打開展開
聚焦爬蟲設(shè)計(jì)與實(shí)現(xiàn),2.46萬字64頁 包括外文翻譯,原創(chuàng)作品,通過查重系統(tǒng)摘要 爬行器(crawler)又可稱為網(wǎng)絡(luò)機(jī)器人(robot)或蜘蛛(spider),通過提取和跟蹤網(wǎng)頁之間的超文本鏈接(hypertextlink),來發(fā)現(xiàn)和收集internet上的可搜索網(wǎng)站的每個(gè)頁面。由于爬行入口也就是初始網(wǎng)頁的不同,以及爬...
![](http://img.queshao.com/images/pcgzh.gif)
![](http://preview.queshao.com/tobuy/583740.gif)
內(nèi)容介紹
此文檔由會(huì)員 第二波打卡 發(fā)布
聚焦爬蟲設(shè)計(jì)與實(shí)現(xiàn)
2.46萬字 64頁 包括外文翻譯,原創(chuàng)作品,通過查重系統(tǒng)
摘 要
爬行器(Crawler)又可稱為網(wǎng)絡(luò)機(jī)器人(Robot)或蜘蛛(Spider),通過提取和跟蹤網(wǎng)頁之間的超文本鏈接(Hypertextlink),來發(fā)現(xiàn)和收集Internet上的可搜索網(wǎng)站的每個(gè)頁面。由于爬行入口也就是初始網(wǎng)頁的不同,以及爬行策略的不同,不同的爬蟲會(huì)搜集到不同的網(wǎng)絡(luò)資源使用通用搜索引擎、通用爬蟲程序搜索時(shí),由于檢索結(jié)果中常常包含較多的與專業(yè)知識(shí)相關(guān)性很小的內(nèi)容,專業(yè)人員需要耗費(fèi)較多的時(shí)間和精力來剔除相關(guān)度小的無用信息。網(wǎng)絡(luò)信息的海量性和動(dòng)態(tài)性,也使得一個(gè)爬蟲程序亦或是一個(gè)搜索引擎都不可能對所有信息進(jìn)行索引。因此,面向某個(gè)特定領(lǐng)域的主題搜索引擎、主題爬蟲、或稱為聚焦搜索引擎、聚焦爬蟲就成為一個(gè)重要的發(fā)展趨勢,本篇文章將研究一個(gè)基于考研主題的聚焦爬蟲。
關(guān)鍵詞:本體;主題;聚焦;爬蟲;特征向量,相關(guān)度
2.46萬字 64頁 包括外文翻譯,原創(chuàng)作品,通過查重系統(tǒng)
摘 要
爬行器(Crawler)又可稱為網(wǎng)絡(luò)機(jī)器人(Robot)或蜘蛛(Spider),通過提取和跟蹤網(wǎng)頁之間的超文本鏈接(Hypertextli
關(guān)鍵詞:本體;主題;聚焦;爬蟲;特征向量,相關(guān)度
TA們正在看...
- led的測量.ppt
- xxx區(qū)公路局工作要點(diǎn).doc
- xxx街道科協(xié)、科技管理工作要點(diǎn).doc
- xxx街道辦事處社會(huì)保障工作要點(diǎn).doc
- xxx區(qū)畜牧獸醫(yī)工作要點(diǎn).doc
- xxx街道婦聯(lián)工作要點(diǎn).doc
- 污水處理廠粗格柵及進(jìn)水泵池模板支設(shè)施工方案.doc
- 人教版小學(xué)一年級(jí)語文下冊生字表.pdf
- 2015最新版-煤礦應(yīng)急救援預(yù)案(含現(xiàn)場處置方案)-最新.doc
- 安全生產(chǎn)事故應(yīng)急救援預(yù)案(備案稿).docx