基于視覺分割的職位信息抽取技術的研究與實現(xiàn).doc
![](http:///template/default/images/docicon2.gif)
![](http:///template/default/images/docicon3.gif)
約48頁DOC格式手機打開展開
基于視覺分割的職位信息抽取技術的研究與實現(xiàn),摘 要 隨著互聯(lián)網的迅速發(fā)展,網絡招聘已經成為一種比較流行的招聘方式。如今越來越多的企業(yè)在公司網站上發(fā)布招聘信息,求職者也紛紛在網上尋找自己喜歡的工作崗位。但是面對這些信息數(shù)據量的不斷增大,我們需要瀏覽和篩選的數(shù)據也越來越多,有時候甚至會因為找不到公司的招聘信息,而在與招聘不相...
![](http://img.queshao.com/images/pcgzh.gif)
![](http://preview.queshao.com/tobuy/1471057.gif)
內容介紹
此文檔由會員 那年三月 發(fā)布
基于視覺分割的職位信息抽取技術的研究與實現(xiàn)
摘 要 隨著互聯(lián)網的迅速發(fā)展,網絡招聘已經成為一種比較流行的招聘方式。如今越來越多的企業(yè)在公司網站上發(fā)布招聘信息,求職者也紛紛在網上尋找自己喜歡的工作崗位。但是面對這些信息數(shù)據量的不斷增大,我們需要瀏覽和篩選的數(shù)據也越來越多,有時候甚至會因為找不到公司的招聘信息,而在與招聘不相關的信息上浪費大量時間,因此如何從大量的、非結構化的網絡信息中快速和準確的抽取我們需要的信息非常重要。
網頁內容的表現(xiàn)性和互動性很強,因此從某種程度上,網頁傳達了一些視覺信息,這些視覺信息對于信息抽取過程會有很大的幫助。本文從人們用眼睛觀察網頁的角度出發(fā),利用網頁所呈現(xiàn)出來的布局結構和視覺特征,分別用DOM樹結構和VIPS 算法對頁面進行視覺分割處理,在頁面分割的基礎上,抽取特定塊內的文本信息,并通過關鍵詞查找抽取人們所感興趣的視覺塊內的信息。