說話人識(shí)別技術(shù)研究進(jìn)展.doc
約11頁DOC格式手機(jī)打開展開
說話人識(shí)別技術(shù)研究進(jìn)展,全文11頁9365字 敘述詳盡摘要:本文從說話人識(shí)別的幾個(gè)關(guān)鍵問題出發(fā),介紹了目前說話人識(shí)別技術(shù)的基本原理、方法以及存在的問題和難點(diǎn)。關(guān)鍵詞:模板匹配法、概率模型法、神經(jīng)網(wǎng)絡(luò)法一、引言說話人識(shí)別是語音識(shí)別的一種。它主要分為說話人辨認(rèn)和說話人確認(rèn)兩個(gè)方面:前者是判斷待識(shí)別語音是多個(gè)參考說話人中哪一個(gè)...


內(nèi)容介紹
此文檔由會(huì)員 周伯通 發(fā)布
說話人識(shí)別技術(shù)研究進(jìn)展
全文11頁9365字 敘述詳盡
摘要:本文從說話人識(shí)別的幾個(gè)關(guān)鍵問題出發(fā),介紹了目前說話人識(shí)別技術(shù)的基本原理、方法以及存在的問題和難點(diǎn)。
關(guān)鍵詞:模板匹配法、概率模型法、神經(jīng)網(wǎng)絡(luò)法
一、 引言
說話人識(shí)別是語音識(shí)別的一種。它主要分為說話人辨認(rèn)和說話人確認(rèn)兩個(gè)方面:前者是判斷待識(shí)別語音是多個(gè)參考說話人中哪一個(gè)人所說,用于辨認(rèn)說話者的身份,是一個(gè)多元判決問題;后者是說話人先聲明身份(如輸入用戶號(hào)) ,然后由系統(tǒng)判定待識(shí)別語音是否與其參考聲音相符,用于對特定人進(jìn)行身份驗(yàn)證,是一個(gè)二元判決問題。
說話人識(shí)別技術(shù)的發(fā)展始于60 年代,隨著信息社會(huì)化發(fā)展,說話人識(shí)別作為具有語音識(shí)別與理解功能的智能人機(jī)接口,是新一代計(jì)算機(jī)的重要組成部分,其應(yīng)用領(lǐng)域不斷擴(kuò)大:在司法領(lǐng)域中,可以幫助對嫌疑人的查證;在保安領(lǐng)域中,可以用于機(jī)密場所的進(jìn)入控制、合法使用通信線路、機(jī)要設(shè)備的身份核查及電子銀行轉(zhuǎn)帳業(yè)務(wù)的安全檢查等;在醫(yī)學(xué)領(lǐng)域,如使識(shí)別系統(tǒng)僅響應(yīng)患者的命令,則可實(shí)現(xiàn)對假肢的控制;在玩具、家用電器等領(lǐng)域也有廣泛的應(yīng)用前景。針對以上領(lǐng)域中的許多商用系統(tǒng)已經(jīng)投入使用。
參考文獻(xiàn)
[1] 曹業(yè)敏,侯風(fēng)雷,王炳錫,說話人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展,河南科技 1998年09期
[2] 寧飛,陳頻,說話人識(shí)別的幾種方法,電聲技術(shù) 2001年 12期
[3] 李燦偉,楊震,基于HMM的說話人確認(rèn)系統(tǒng)的研究,南京郵電學(xué)院學(xué)報(bào)(自然科學(xué)版) 2001年02期
[4] 王濤,徐乃平,說話人識(shí)別及其應(yīng)用的研究,微處理機(jī) 1997年04期
[5]C. R Jankowski Jr., T. F. Quatierui, D. A. Reynolds. Fine Structure Features for Speaker Identification. The 1996 IEEE International Conference on Acoustics, Speech and Signal Processing Conference Proceedings, 1996, (7-10):680-692.
[6] 吳志強(qiáng),HMM用于說話人識(shí)別的研究及系統(tǒng)實(shí)現(xiàn)[D],北京:北京大學(xué),1996
[7]C. W. Che, Q. G. Yuk. An HMM Approach to Text-Prompted Speak Verification. The 1996 IEEE International Conference On Acoustics, Speech and Signal Processing Conference Proceedings, 1996, (7-10):673-676.
[8]M Birnbaum, K. L. Brown, S. Bardenhagen. Text-independent Speaker Identification Using Fenonic Speaker Markov Modeling. The 1996 IEEE International Conference on Acoustics, Speech and Signal Processing Conference Proceedings, 1996, 677-680.
[9]Y. H. Pao. Adaptive Pattern Recognition and Neural Networks, Addison-Wesley Publishing Company, Inc, 1989. 馬頌德等譯,《自適應(yīng)模式識(shí)別與神經(jīng)網(wǎng)絡(luò)》,北京:科學(xué)出版社,1992
全文11頁9365字 敘述詳盡
摘要:本文從說話人識(shí)別的幾個(gè)關(guān)鍵問題出發(fā),介紹了目前說話人識(shí)別技術(shù)的基本原理、方法以及存在的問題和難點(diǎn)。
關(guān)鍵詞:模板匹配法、概率模型法、神經(jīng)網(wǎng)絡(luò)法
一、 引言
說話人識(shí)別是語音識(shí)別的一種。它主要分為說話人辨認(rèn)和說話人確認(rèn)兩個(gè)方面:前者是判斷待識(shí)別語音是多個(gè)參考說話人中哪一個(gè)人所說,用于辨認(rèn)說話者的身份,是一個(gè)多元判決問題;后者是說話人先聲明身份(如輸入用戶號(hào)) ,然后由系統(tǒng)判定待識(shí)別語音是否與其參考聲音相符,用于對特定人進(jìn)行身份驗(yàn)證,是一個(gè)二元判決問題。
說話人識(shí)別技術(shù)的發(fā)展始于60 年代,隨著信息社會(huì)化發(fā)展,說話人識(shí)別作為具有語音識(shí)別與理解功能的智能人機(jī)接口,是新一代計(jì)算機(jī)的重要組成部分,其應(yīng)用領(lǐng)域不斷擴(kuò)大:在司法領(lǐng)域中,可以幫助對嫌疑人的查證;在保安領(lǐng)域中,可以用于機(jī)密場所的進(jìn)入控制、合法使用通信線路、機(jī)要設(shè)備的身份核查及電子銀行轉(zhuǎn)帳業(yè)務(wù)的安全檢查等;在醫(yī)學(xué)領(lǐng)域,如使識(shí)別系統(tǒng)僅響應(yīng)患者的命令,則可實(shí)現(xiàn)對假肢的控制;在玩具、家用電器等領(lǐng)域也有廣泛的應(yīng)用前景。針對以上領(lǐng)域中的許多商用系統(tǒng)已經(jīng)投入使用。
參考文獻(xiàn)
[1] 曹業(yè)敏,侯風(fēng)雷,王炳錫,說話人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展,河南科技 1998年09期
[2] 寧飛,陳頻,說話人識(shí)別的幾種方法,電聲技術(shù) 2001年 12期
[3] 李燦偉,楊震,基于HMM的說話人確認(rèn)系統(tǒng)的研究,南京郵電學(xué)院學(xué)報(bào)(自然科學(xué)版) 2001年02期
[4] 王濤,徐乃平,說話人識(shí)別及其應(yīng)用的研究,微處理機(jī) 1997年04期
[5]C. R Jankowski Jr., T. F. Quatierui, D. A. Reynolds. Fine Structure Features for Speaker Identification. The 1996 IEEE International Conference on Acoustics, Speech and Signal Processing Conference Proceedings, 1996, (7-10):680-692.
[6] 吳志強(qiáng),HMM用于說話人識(shí)別的研究及系統(tǒng)實(shí)現(xiàn)[D],北京:北京大學(xué),1996
[7]C. W. Che, Q. G. Yuk. An HMM Approach to Text-Prompted Speak Verification. The 1996 IEEE International Conference On Acoustics, Speech and Signal Processing Conference Proceedings, 1996, (7-10):673-676.
[8]M Birnbaum, K. L. Brown, S. Bardenhagen. Text-independent Speaker Identification Using Fenonic Speaker Markov Modeling. The 1996 IEEE International Conference on Acoustics, Speech and Signal Processing Conference Proceedings, 1996, 677-680.
[9]Y. H. Pao. Adaptive Pattern Recognition and Neural Networks, Addison-Wesley Publishing Company, Inc, 1989. 馬頌德等譯,《自適應(yīng)模式識(shí)別與神經(jīng)網(wǎng)絡(luò)》,北京:科學(xué)出版社,1992