基于trigger模型的音頻檢索研究.doc


約49頁DOC格式手機打開展開
基于trigger模型的音頻檢索研究,2.64萬字 49頁 原創(chuàng)作品,已通過查重系統(tǒng)摘要傳統(tǒng)的音樂檢索基本上是基于歌名、歌手、歌詞中的關鍵詞等從曲庫中檢索出符合條件的音樂作品。在基于內(nèi)容的音樂檢索技術的研究中,通??紤]音樂的節(jié)奏、音色、音高、強度等物理特征作為內(nèi)容進行匹配檢索,由于這些特征過于專業(yè)化,很難得到用戶的接受。...


內(nèi)容介紹
此文檔由會員 第二波打卡 發(fā)布
基于trigger模型的音頻檢索研究
2.64萬字 49頁 原創(chuàng)作品,已通過查重系統(tǒng)
摘 要
傳統(tǒng)的音樂檢索基本上是基于歌名、歌手、歌詞中的關鍵詞等從曲庫中檢索出符合條件的音樂作品。在基于內(nèi)容的音樂檢索技術的研究中,通??紤]音樂的節(jié)奏、音色、音高、強度等物理特征作為內(nèi)容進行匹配檢索,由于這些特征過于專業(yè)化,很難得到用戶的接受。Web2.0的發(fā)展提供了用戶自由行為,用戶可以通過自己對音樂的理解定義標簽,不同的標簽從不同角度詮釋著用戶對音樂的理解。標簽之間就存在trigger關系,即觸發(fā)關系。
本文主要研究的是語義標簽的trigger檢索問題,將標簽互相關聯(lián),利用最大熵原理來搭建trigger模型,利用trigger模型,即觸發(fā)對,有“強標簽”(觸發(fā)標簽)和“弱標簽”(被觸發(fā)標簽),若“強標簽”(觸發(fā)標簽)標注了一首歌曲,則能夠提高“弱標簽”(被觸發(fā)標簽)標注這首歌曲的概率。標簽標注歌曲是利用自動語義標注技術實現(xiàn)的,最大熵原理是一種選擇隨機變量統(tǒng)計特性最符合客觀情況的準則。一個標簽可與多個標簽相關聯(lián),那么這多個標簽對于這一個標簽來說就擁有了隨機變量統(tǒng)計特性,但是符合上述條件的分布有多種,通常,其中有一種分布熵最大。選用此種熵最大的分布作為該隨機變量的分布,是一種有效的處理方法和準則,當我們利用最大熵原理構建好trigger標簽以后,一首歌就能被多個標簽準確的標注了,這樣能夠方便更加方便用戶檢索到自己想要的歌曲。
本文著重介紹里用最大熵原理搭建trigger模型,使用trigger模型加強標簽間的相互關聯(lián)性,通過“強標簽”改善“弱標簽”的標注概率,增強標簽標注歌曲的準確率,并對標簽標注的準確率進行了實驗檢測,通過實驗結果證明了此方法的可行性。
【關鍵詞】最大熵原理;trigger模型;自動語義標注;觸發(fā)對;標簽
2.64萬字 49頁 原創(chuàng)作品,已通過查重系統(tǒng)
摘 要
傳統(tǒng)的音樂檢索基本上是基于歌名、歌手、歌詞中的關鍵詞等從曲庫中檢索出符合條件的音樂作品。在基于內(nèi)容的音樂檢索技術的研究中,通??紤]音樂的節(jié)奏、音色、音高、強度等物理特征作為內(nèi)容進行匹配檢索,由于這些特征過于專業(yè)化,很難得到用戶的接受。Web2.0的發(fā)展提供了用戶自由行為,用戶可以通過自己對音樂的理解定義標簽,不同的標簽從不同角度詮釋著用戶對音樂的理解。標簽之間就存在trigger關系,即觸發(fā)關系。
本文主要研究的是語義標簽的trigger檢索問題,將標簽互相關聯(lián),利用最大熵原理來搭建trigger模型,利用trigger模型,即觸發(fā)對,有“強標簽”(觸發(fā)標簽)和“弱標簽”(被觸發(fā)標簽),若“強標簽”(觸發(fā)標簽)標注了一首歌曲,則能夠提高“弱標簽”(被觸發(fā)標簽)標注這首歌曲的概率。標簽標注歌曲是利用自動語義標注技術實現(xiàn)的,最大熵原理是一種選擇隨機變量統(tǒng)計特性最符合客觀情況的準則。一個標簽可與多個標簽相關聯(lián),那么這多個標簽對于這一個標簽來說就擁有了隨機變量統(tǒng)計特性,但是符合上述條件的分布有多種,通常,其中有一種分布熵最大。選用此種熵最大的分布作為該隨機變量的分布,是一種有效的處理方法和準則,當我們利用最大熵原理構建好trigger標簽以后,一首歌就能被多個標簽準確的標注了,這樣能夠方便更加方便用戶檢索到自己想要的歌曲。
本文著重介紹里用最大熵原理搭建trigger模型,使用trigger模型加強標簽間的相互關聯(lián)性,通過“強標簽”改善“弱標簽”的標注概率,增強標簽標注歌曲的準確率,并對標簽標注的準確率進行了實驗檢測,通過實驗結果證明了此方法的可行性。
【關鍵詞】最大熵原理;trigger模型;自動語義標注;觸發(fā)對;標簽