語音識別在語言培訓(xùn)軟件中的研究與應(yīng)用.doc
約54頁DOC格式手機打開展開
語音識別在語言培訓(xùn)軟件中的研究與應(yīng)用,頁數(shù) 54 字數(shù) 28642摘 要語音識別技術(shù)是21世紀初信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。長期以來,人們夢想與機器進行自然語音的交流,讓機器明白你說什么。語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。近二十年來,語音識別技術(shù)取得顯著進步,當(dāng)...
內(nèi)容介紹
此文檔由會員 李亮亮 發(fā)布
語音識別在語言培訓(xùn)軟件中的研究與應(yīng)用
頁數(shù) 54 字數(shù) 28642
摘 要
語音識別技術(shù)是21世紀初信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。長期以來,人們夢想與機器進行自然語音的交流,讓機器明白你說什么。語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。近二十年來,語音識別技術(shù)取得顯著進步,當(dāng)今,語音識別技術(shù)已日臻完善,并已進入實用階段,采用嵌入式芯片設(shè)計技術(shù)研發(fā)的語音識別專用芯片系統(tǒng),已包括了語音識別、語音編碼、語音合成功能,該芯片大量用于智能語音玩具、手機等電子產(chǎn)品,一些應(yīng)用型產(chǎn)品正在研發(fā)中,其商品化的過程也越來越快。目前,在信息處理、教育與商務(wù)應(yīng)用、消費電子應(yīng)用方面,語音識別技術(shù)都已經(jīng)展現(xiàn)出了它的巨大優(yōu)勢,但將語音識別和語音比較技術(shù)同時運用在教育培訓(xùn)軟件還比較少,特別用于外語培訓(xùn)軟件系列,更是鳳毛麟角了。我們正是根據(jù)這一實際工程領(lǐng)域的缺欠進行研究,初利用現(xiàn)有語音識別技術(shù),并根據(jù)英語培訓(xùn)的特點加以改造,同時引入語音比較技術(shù),大大提高學(xué)生學(xué)習(xí)英語樂趣,對中國人糾正英語的發(fā)音大有幫助。
我們在本課題中的設(shè)想是將語音識別技術(shù)應(yīng)用在英語培訓(xùn)軟件中,并就教育培訓(xùn)的一些新特點,在原有語音識別技術(shù)上,利用新的模式匹配算法,增加語音比較功能。就教育領(lǐng)域來講,語音識別技術(shù)的最直接的應(yīng)用就是幫助用戶更好地練習(xí)語言技巧。在過去,用戶只是通過簡單的模仿來進行學(xué)習(xí),而無法精確地比較自己發(fā)音的差異,為實現(xiàn)該功能,我們將引入語音比較的識別模式,當(dāng)用戶跟著計算機說完一句話后,計算機會根據(jù)標(biāo)準發(fā)音和用戶發(fā)音的波形按特定算法進行相似性的比較,由此估計用戶的發(fā)音是否與標(biāo)準有細節(jié)方面的差異。同時,基于語音比較技術(shù)而給出的分數(shù)也更具有公正性,并可以激勵用戶的學(xué)習(xí)潛質(zhì);
關(guān)鍵詞:語音識別,語音比較,模式匹配,算法,計算機,波形比較
目 錄
第一章 引 言 1
1.1 語音識別和語音比較概述 1
1.2 語音識別技術(shù)的國內(nèi)外研究動態(tài) 2
1.3 論文的研究目的意義及主要工作 3
第二章 語音識別的基本概念及其技術(shù) 5
2.1 語音識別系統(tǒng)的分類 5
2.2 語音識別的基本方法 5
2.3 語音識別的主要技術(shù) 5
2.3.1 特征參數(shù)匹配法 5
2.3.2 隱馬爾科夫法(HMM) 6
2.3.3 矢量量化(VQ) 6
2.3.4 神經(jīng)網(wǎng)絡(luò)法(ANN) 6
2.4 語音識別的關(guān)鍵技術(shù) 7
2.4.1 特征參數(shù)提取技術(shù) 7
2.4.2 模式匹配及模型訓(xùn)練技術(shù) 8
2.4.3 語音識別單元的選取 9
第三章 語音識別的難點和對策 10
3.1 語音識別的難點 10
3.2 語音識別系統(tǒng)的對策-DSP實現(xiàn) 11
第四章 語音識別現(xiàn)有技術(shù)及優(yōu)劣 13
4.1 選擇識別引擎應(yīng)考慮的因素 13
4.2 IBM語音識別的基本原理 14
4.3 微軟語音識別的基本原理 14
4.3 選擇微軟識別引擎的理由 16
第五章 英語培訓(xùn)軟件總體設(shè)計 17
5.1 系統(tǒng)概述 17
5.2 主要模塊和功能描述 17
5.3 系統(tǒng)特點 18
5.4 軟、硬件平臺及環(huán)境要求 19
5.4.1 硬件平臺 19
5.4.2 軟件平臺 19
第六章 語音處理算法設(shè)計 20
6.1 總體設(shè)計 20
6.2 語音處理算法設(shè)計 24
6.3 算法特點 24
6.4 語音識別算法設(shè)計 24
6.4.1 基本思路 24
6.4.2 微軟語音識別主要接口介紹 25
6.4.3 程序設(shè)計 28
6.4.4 實驗結(jié)果 30
6.4.5 算法改進 33
6.5 波形比較算法分析與選擇 34
6.5.1 概述 34
6.5.2 DP Matching算法 34
6.5.3 誤差能量[16]算法 37
6.5.4 波形比較算法設(shè)計 37
第七章 實驗結(jié)果與討論 44
7.1 語音識別實驗結(jié)果 44
7.2 波形比較實驗結(jié)果 44
第八章 結(jié)論和改進建議 47
8.1 結(jié)論 47
8.2 改進建議 47
8.3 展望 48
參考文獻 49
致 謝 50
參考文獻
[1] 王炳錫,屈丹,彭煊. 實用語音識別基礎(chǔ)(21世紀高等院校優(yōu)秀教材). 國防工業(yè)出版社,2005.1
[2] 王小捷,常寶寶. 自然語言處理技術(shù)基礎(chǔ). 北京:北京郵電大學(xué)出版社,2002.12:50~101.
[3] 朱民雄.計算機語言技術(shù).北京:北京航空航天大學(xué)出版社.1992.12(2):186~224.
[4] Sergios Theodoridis,Konstantinos . Pattern Recognition ,Second Edition . Elsevier Science,2003,9(2):208~253.
[5] Rabiner, L. Fundamentals of Speech Recognition,2005.
頁數(shù) 54 字數(shù) 28642
摘 要
語音識別技術(shù)是21世紀初信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。長期以來,人們夢想與機器進行自然語音的交流,讓機器明白你說什么。語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。近二十年來,語音識別技術(shù)取得顯著進步,當(dāng)今,語音識別技術(shù)已日臻完善,并已進入實用階段,采用嵌入式芯片設(shè)計技術(shù)研發(fā)的語音識別專用芯片系統(tǒng),已包括了語音識別、語音編碼、語音合成功能,該芯片大量用于智能語音玩具、手機等電子產(chǎn)品,一些應(yīng)用型產(chǎn)品正在研發(fā)中,其商品化的過程也越來越快。目前,在信息處理、教育與商務(wù)應(yīng)用、消費電子應(yīng)用方面,語音識別技術(shù)都已經(jīng)展現(xiàn)出了它的巨大優(yōu)勢,但將語音識別和語音比較技術(shù)同時運用在教育培訓(xùn)軟件還比較少,特別用于外語培訓(xùn)軟件系列,更是鳳毛麟角了。我們正是根據(jù)這一實際工程領(lǐng)域的缺欠進行研究,初利用現(xiàn)有語音識別技術(shù),并根據(jù)英語培訓(xùn)的特點加以改造,同時引入語音比較技術(shù),大大提高學(xué)生學(xué)習(xí)英語樂趣,對中國人糾正英語的發(fā)音大有幫助。
我們在本課題中的設(shè)想是將語音識別技術(shù)應(yīng)用在英語培訓(xùn)軟件中,并就教育培訓(xùn)的一些新特點,在原有語音識別技術(shù)上,利用新的模式匹配算法,增加語音比較功能。就教育領(lǐng)域來講,語音識別技術(shù)的最直接的應(yīng)用就是幫助用戶更好地練習(xí)語言技巧。在過去,用戶只是通過簡單的模仿來進行學(xué)習(xí),而無法精確地比較自己發(fā)音的差異,為實現(xiàn)該功能,我們將引入語音比較的識別模式,當(dāng)用戶跟著計算機說完一句話后,計算機會根據(jù)標(biāo)準發(fā)音和用戶發(fā)音的波形按特定算法進行相似性的比較,由此估計用戶的發(fā)音是否與標(biāo)準有細節(jié)方面的差異。同時,基于語音比較技術(shù)而給出的分數(shù)也更具有公正性,并可以激勵用戶的學(xué)習(xí)潛質(zhì);
關(guān)鍵詞:語音識別,語音比較,模式匹配,算法,計算機,波形比較
目 錄
第一章 引 言 1
1.1 語音識別和語音比較概述 1
1.2 語音識別技術(shù)的國內(nèi)外研究動態(tài) 2
1.3 論文的研究目的意義及主要工作 3
第二章 語音識別的基本概念及其技術(shù) 5
2.1 語音識別系統(tǒng)的分類 5
2.2 語音識別的基本方法 5
2.3 語音識別的主要技術(shù) 5
2.3.1 特征參數(shù)匹配法 5
2.3.2 隱馬爾科夫法(HMM) 6
2.3.3 矢量量化(VQ) 6
2.3.4 神經(jīng)網(wǎng)絡(luò)法(ANN) 6
2.4 語音識別的關(guān)鍵技術(shù) 7
2.4.1 特征參數(shù)提取技術(shù) 7
2.4.2 模式匹配及模型訓(xùn)練技術(shù) 8
2.4.3 語音識別單元的選取 9
第三章 語音識別的難點和對策 10
3.1 語音識別的難點 10
3.2 語音識別系統(tǒng)的對策-DSP實現(xiàn) 11
第四章 語音識別現(xiàn)有技術(shù)及優(yōu)劣 13
4.1 選擇識別引擎應(yīng)考慮的因素 13
4.2 IBM語音識別的基本原理 14
4.3 微軟語音識別的基本原理 14
4.3 選擇微軟識別引擎的理由 16
第五章 英語培訓(xùn)軟件總體設(shè)計 17
5.1 系統(tǒng)概述 17
5.2 主要模塊和功能描述 17
5.3 系統(tǒng)特點 18
5.4 軟、硬件平臺及環(huán)境要求 19
5.4.1 硬件平臺 19
5.4.2 軟件平臺 19
第六章 語音處理算法設(shè)計 20
6.1 總體設(shè)計 20
6.2 語音處理算法設(shè)計 24
6.3 算法特點 24
6.4 語音識別算法設(shè)計 24
6.4.1 基本思路 24
6.4.2 微軟語音識別主要接口介紹 25
6.4.3 程序設(shè)計 28
6.4.4 實驗結(jié)果 30
6.4.5 算法改進 33
6.5 波形比較算法分析與選擇 34
6.5.1 概述 34
6.5.2 DP Matching算法 34
6.5.3 誤差能量[16]算法 37
6.5.4 波形比較算法設(shè)計 37
第七章 實驗結(jié)果與討論 44
7.1 語音識別實驗結(jié)果 44
7.2 波形比較實驗結(jié)果 44
第八章 結(jié)論和改進建議 47
8.1 結(jié)論 47
8.2 改進建議 47
8.3 展望 48
參考文獻 49
致 謝 50
參考文獻
[1] 王炳錫,屈丹,彭煊. 實用語音識別基礎(chǔ)(21世紀高等院校優(yōu)秀教材). 國防工業(yè)出版社,2005.1
[2] 王小捷,常寶寶. 自然語言處理技術(shù)基礎(chǔ). 北京:北京郵電大學(xué)出版社,2002.12:50~101.
[3] 朱民雄.計算機語言技術(shù).北京:北京航空航天大學(xué)出版社.1992.12(2):186~224.
[4] Sergios Theodoridis,Konstantinos . Pattern Recognition ,Second Edition . Elsevier Science,2003,9(2):208~253.
[5] Rabiner, L. Fundamentals of Speech Recognition,2005.