基于空間視覺詞袋模型的靜態(tài)圖像行為分類.doc
約44頁DOC格式手機打開展開
基于空間視覺詞袋模型的靜態(tài)圖像行為分類,2.37萬字44頁 原創(chuàng)作品,已通過查重系統(tǒng) 摘要 隨著互聯(lián)網(wǎng)和多媒體技術的飛速發(fā)展,數(shù)字圖像、視頻等多媒體信息的數(shù)量呈爆炸式增長。為了準確、高效地組織、管理和檢索圖像,需要計算機能準確地理解圖像的內容。圖像分類是解決圖像理解問題的重要途徑,對多媒體檢索技術的發(fā)展有重要的推動作用。...
內容介紹
此文檔由會員 大雨傾盆 發(fā)布
基于空間視覺詞袋模型的靜態(tài)圖像行為分類
2.37萬字 44頁 原創(chuàng)作品,已通過查重系統(tǒng)
摘要 隨著互聯(lián)網(wǎng)和多媒體技術的飛速發(fā)展,數(shù)字圖像、視頻等多媒體信息的數(shù)量呈爆炸式增長。為了準確、高效地組織、管理和檢索圖像,需要計算機能準確地理解圖像的內容。圖像分類是解決圖像理解問題的重要途徑,對多媒體檢索技術的發(fā)展有重要的推動作用。目前,有關靜態(tài)圖像的行為分類研究也慢慢的受到更多人的關注。傳統(tǒng)的靜態(tài)圖像行為分類方法是根據(jù)圖像中視覺詞匯出現(xiàn)的總體情況進行分類的,既沒有考慮視覺詞匯在空間的分布特點,也沒有利用圖像中區(qū)域語義構成的上下文信息,而這些是絕不能被忽視的,本論文主要研究的空間視覺詞袋模型正是為了解決傳統(tǒng)場景分類方法存在的缺陷而提出的。
本論文主要研究兩種特征提取方法,分別為傳統(tǒng)視覺詞袋法和結合了圖像空間信息的空間視覺詞袋法,通過將兩種特征提取方法與直方圖交叉核支持向量機、rbf核支持向量機和自適應增強算法三種分類器相結合,根據(jù)所得的分類結果,比較空間視覺詞袋法相對于傳統(tǒng)視覺詞袋法有那些改善和不足。經(jīng)本論文實驗表明,當訓練集數(shù)量選取得當時,在與支持向量機結合時,空間視覺詞袋法較傳統(tǒng)視覺詞袋法有較明顯的改善,而與Adaboost結合時效果不佳。
本論文前兩章主要介紹了圖像分類的背景、發(fā)展、研究現(xiàn)狀等,及圖像分類的幾種方法,包括特征提取和分類器兩方面。其中,特征提取分全局特征和局部特征;分類器分生成模型和判別模型。本論文的第三章為本論文的核心部分,主要介紹了視覺詞袋法和空間視覺詞袋法及LibSVM工具箱的簡要介紹。本論文第四章為在matlab上運行相應程序所得的相應結果及對所得結果的分析。
關鍵詞:靜態(tài)圖像行為分類 空間視覺詞袋模型 空間視覺詞典
2.37萬字 44頁 原創(chuàng)作品,已通過查重系統(tǒng)
摘要 隨著互聯(lián)網(wǎng)和多媒體技術的飛速發(fā)展,數(shù)字圖像、視頻等多媒體信息的數(shù)量呈爆炸式增長。為了準確、高效地組織、管理和檢索圖像,需要計算機能準確地理解圖像的內容。圖像分類是解決圖像理解問題的重要途徑,對多媒體檢索技術的發(fā)展有重要的推動作用。目前,有關靜態(tài)圖像的行為分類研究也慢慢的受到更多人的關注。傳統(tǒng)的靜態(tài)圖像行為分類方法是根據(jù)圖像中視覺詞匯出現(xiàn)的總體情況進行分類的,既沒有考慮視覺詞匯在空間的分布特點,也沒有利用圖像中區(qū)域語義構成的上下文信息,而這些是絕不能被忽視的,本論文主要研究的空間視覺詞袋模型正是為了解決傳統(tǒng)場景分類方法存在的缺陷而提出的。
本論文主要研究兩種特征提取方法,分別為傳統(tǒng)視覺詞袋法和結合了圖像空間信息的空間視覺詞袋法,通過將兩種特征提取方法與直方圖交叉核支持向量機、rbf核支持向量機和自適應增強算法三種分類器相結合,根據(jù)所得的分類結果,比較空間視覺詞袋法相對于傳統(tǒng)視覺詞袋法有那些改善和不足。經(jīng)本論文實驗表明,當訓練集數(shù)量選取得當時,在與支持向量機結合時,空間視覺詞袋法較傳統(tǒng)視覺詞袋法有較明顯的改善,而與Adaboost結合時效果不佳。
本論文前兩章主要介紹了圖像分類的背景、發(fā)展、研究現(xiàn)狀等,及圖像分類的幾種方法,包括特征提取和分類器兩方面。其中,特征提取分全局特征和局部特征;分類器分生成模型和判別模型。本論文的第三章為本論文的核心部分,主要介紹了視覺詞袋法和空間視覺詞袋法及LibSVM工具箱的簡要介紹。本論文第四章為在matlab上運行相應程序所得的相應結果及對所得結果的分析。
關鍵詞:靜態(tài)圖像行為分類 空間視覺詞袋模型 空間視覺詞典