語音軟件的應用和開發(fā)設計.rar
語音軟件的應用和開發(fā)設計,頁數(shù)70頁 字數(shù) 4.1萬字注意本論文包含完整的畢業(yè)論文_扉頁.doc 畢業(yè)設計_目錄.doc 畢業(yè)設計_摘要.doc 畢業(yè)設計_正文.doc 畢業(yè)設計_翻譯和開題報告畢業(yè)設計_任務書 還包括能運行的本論文開發(fā)實現(xiàn)的源程序摘要計算機語音技術是語音領域的一個重要部分,包括四種技術,即語音分析技術、...
該文檔為壓縮文件,包含的文件列表如下:
內容介紹
原文檔由會員 云貝貝 發(fā)布
語音軟件的應用和開發(fā)設計
頁數(shù) 70頁 字數(shù) 4.1萬字
注意 本論文包含完整的畢業(yè)論文_扉頁.doc
畢業(yè)設計_目錄.doc
畢業(yè)設計_摘要.doc
畢業(yè)設計_正文.doc
畢業(yè)設計_翻譯和開題報告
畢業(yè)設計_任務書
還包括能運行的本論文開發(fā)實現(xiàn)的源程序
摘 要
計算機語音技術是語音領域的一個重要部分,包括四種技術,即語音分析技術、語音存儲與再生技術、語音合成技術和語音識別技術。語音合成技術是利用計算機一類機器,按人們預定的程序和指令,人為地產(chǎn)生出音素、音節(jié)、詞和句子的技術。語音合成技術不但可以用于人——機——人通信系統(tǒng),而且也是語音學研究的一種重要手段,對于揭示語音產(chǎn)生和語言感知機制具有重要意義。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變?yōu)橄鄳奈谋净蛎畹母呒壖夹g。這一技術的應用將從根本上改變計算機的人機界面,從而對計算機的發(fā)展以及推廣應用產(chǎn)生深遠的影響。綜上所述,研究和探討計算機語音技術這一課題具有深遠的理論意義和廣泛的應用前景。
本文詳細介紹了計算機語音技術的兩大分支──語音合成和語音識別技術。通過對其發(fā)展歷史的回顧和其原理的論述,分析了語音合成和語音識別中的關鍵技術,并指出語音技術在現(xiàn)實生活中各個領域的應用,以及目前的語音系統(tǒng)所存在的缺陷和今后的發(fā)展方向。在論述計算機語音技術原理的基礎上,作者對微軟公司的語音軟件開發(fā)包Microsoft Speech SDK5.1進行了研究,并且總結了利用該開發(fā)包基于VC++6.0實現(xiàn)文本¬¬──語音轉換系統(tǒng)(Text-to-Speech, TTS)和語音識別系統(tǒng)(Speech Recognition)的具體過程。通過對以上理論的研究和探索,作者設計開發(fā)了一個功能較齊全的語音軟件,它具有文本¬¬¬──語音轉換、語音校對、將文本內容保存為wav文件、語音錄入等功能,并有良好的人機交互界面。
關鍵詞:計算機語音技術;語音合成;語音識別;組件對象模型(COM)
目 錄
1 緒論 …………….……………………………………………………………….. 1
1.1 語音技術概述 ……………………………………………………………………...1
1.2 研究語音技術的重要意義 ………………………………………….……………2
2 語音技術的基礎知識 …………………………………………………………... 4
2.1 發(fā)音的生理機構與過程 ………………………………………………………….4
2.1.1 發(fā)音的生理機構 ……………………………………………………………. 4
2.1.2 語音的產(chǎn)生過程 ……………………………………………………………..4
2.1.3 語音分類 ………………………………………………………………………5
2.2 語音的基本特性 ………………………………………………………………… 6
2.2.1 語音的物理屬性 ……………………………………………………………..6
2.2.2 漢語語音基礎及其特性 ……………………………………………………6
2.2.3 語音的波形特征 ……………………………………………………………..8
2.2.4 語音的頻譜特性 ……………………………………………………………..9
2.2.5 語音的音律特性 ……………………………………………………………12
3 語音合成技術 …………………………………………………………………..13
3.1 語音合成技術簡介 ……………………………………………………………. 13
3.1.1 語音合成概述 ………………………………………………………………13
3.1.2 國內外語音合成技術的發(fā)展情況 ………………………………………13
3.2 語音合成原理 …………………………………………………………………….14
3.2.1 共振峰合成 ………………………………………………………………….15
3.2.2 LPC參數(shù) ……………………………………………………………………...17
3.2.3 PSOLA合成技術 ……………………………………………………………17
3.2.4 LMA聲道模型 ………………………………………………………………18
3.3 文本──語音轉換系統(tǒng)(Text to Speech, TTS) ……………………………19
3.3.1 TTS的發(fā)展 …………………………………………………………………..19
3.3.2 TTS的組成部分 …………………………………………………………….21
3.3.3 TTS的典型應用 …………………………………………………………….23
3.4 語音合成發(fā)展方向 ………………………………………………………………25
4 語音識別技術 ………………………………………………………………….27
4.1 語音識別技術簡介 ………………………………………………………………27
4.1.1語音識別概述 ……………………………………………………………….27
4.1.2國內外語音識別技術的發(fā)展情況 ……………………………………….29
4.2 語音識別的定義、原理和分類 …………………………………………………30
4.2.1 語音識別的定義 ……………………………………………………………30
4.2.2 語音識別的基本原理 ……………………………………………………...30
4.2.3 語音識別的分類 ……………………………………………………………31
4.3 語音識別的關鍵技術 ………………………………………………………….32
4.3.1 語音識別單元的選取 ……………………………………………………...33
4.3.2 特征參數(shù)提取技術 ………………………………………………………...33
4.3.3 模式匹配及模型訓練技術 ……………………………………………….34
4.4 語音識別的應用及發(fā)展趨勢 …………………………………………………34
4.4.1 語音識別的應用 ……………………………………………………………34
4.4.2 語音識別的發(fā)展趨勢 ……………………………………………………...35
5 語音軟件的設計和開發(fā) ………………………………………………………..38
5.1 COM簡介 ………………………………………………………………………..38
5.1.1 COM定義及COM接口 …………………………………………………..38
5.1.2 COM的基本概念 …………………………………………………………...39
5.1.3 COM對象的使用和處理 ………………………………………………….40
5.1.4 基本接口—─IUnknown ……………………………………..………….43
5.1.5 Unicode串處理 ……………………………………………………………...44
5.2 關于Microsoft Speech SDK5.1 ……………………………………………….46
5.2.1文本—語音轉換API (API for Text-to-Speech) ………………………47
5.2.2 語音識別API (API for Speech Recognition)………………………47
5.3 用VC++實現(xiàn)TTS和SR的過程 ……………………………………………..48
5.3.1 實現(xiàn)TTS的過程 ……………………………………………………………48
5.3.2 實現(xiàn)SR的過程 ……………………………………………………………..52
5.3.3 系統(tǒng)分析和測試 ……………………………………………………………54
6 結論 ……………………………………………………………………………..65
致謝
參考文獻
參考文獻
[1] 朱民雄,聞新,黃健群,周露.計算機語音技術.北京:北京航空航天大學出版社,2002年1月第一版.
[2] 張成海,張鐸.現(xiàn)代自動識別技術與應用.北京:清華大學出版社,2003年4月第一版.
[3] 康博創(chuàng)作室.Visual C++60 高級編程.北京:清華大學出版社,1997年7月第一版.
[4] Kate Gregory.Visual C++6 開發(fā)使用手冊. 機械工業(yè)出版社,1992年2月第一版.
[5] 余英,梁剛. Visual C++ 實踐與提高—COM和COM+篇.中國鐵道出版社,2001年2月第一版
[6] 潘愛民.COM原理與應用.北京:清華大學出版社,1999年11月第一版.
[7] Gregory Brill. 精通COM+[M].機械工業(yè)出版社, 黃志軍,任雄偉,劉啟忠等譯.2002年9月第一版.
[8] DON BOX.COM本質論(Essential COM).中國電力出版社,潘愛民譯,2001年8月第一版.
[9] 宋陽.利用SAPI5.0進行語素分解
[10] 約翰•斯萬科著,徐潁譯.COM編程精彩實例.中國電力出版社.2001年6月第一版.
[11] 李逸波,郭天杰,王華駒.最新語音識別技術.北京:電子工業(yè)出版社,1998
[12] 安居院猛,中嵨正之.計算機語音處理(日).北京:國防工業(yè)出版社,1987
[13] 陳永彬.語音信號處理.上海:上海交通大學出版社,1990
[14] 岳東劍,等.應用小波分析技術進行漢語語音基音頻率分析的研究.模式識別與人工智能.2000.13(2):235~237
頁數(shù) 70頁 字數(shù) 4.1萬字
注意 本論文包含完整的畢業(yè)論文_扉頁.doc
畢業(yè)設計_目錄.doc
畢業(yè)設計_摘要.doc
畢業(yè)設計_正文.doc
畢業(yè)設計_翻譯和開題報告
畢業(yè)設計_任務書
還包括能運行的本論文開發(fā)實現(xiàn)的源程序
摘 要
計算機語音技術是語音領域的一個重要部分,包括四種技術,即語音分析技術、語音存儲與再生技術、語音合成技術和語音識別技術。語音合成技術是利用計算機一類機器,按人們預定的程序和指令,人為地產(chǎn)生出音素、音節(jié)、詞和句子的技術。語音合成技術不但可以用于人——機——人通信系統(tǒng),而且也是語音學研究的一種重要手段,對于揭示語音產(chǎn)生和語言感知機制具有重要意義。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變?yōu)橄鄳奈谋净蛎畹母呒壖夹g。這一技術的應用將從根本上改變計算機的人機界面,從而對計算機的發(fā)展以及推廣應用產(chǎn)生深遠的影響。綜上所述,研究和探討計算機語音技術這一課題具有深遠的理論意義和廣泛的應用前景。
本文詳細介紹了計算機語音技術的兩大分支──語音合成和語音識別技術。通過對其發(fā)展歷史的回顧和其原理的論述,分析了語音合成和語音識別中的關鍵技術,并指出語音技術在現(xiàn)實生活中各個領域的應用,以及目前的語音系統(tǒng)所存在的缺陷和今后的發(fā)展方向。在論述計算機語音技術原理的基礎上,作者對微軟公司的語音軟件開發(fā)包Microsoft Speech SDK5.1進行了研究,并且總結了利用該開發(fā)包基于VC++6.0實現(xiàn)文本¬¬──語音轉換系統(tǒng)(Text-to-Speech, TTS)和語音識別系統(tǒng)(Speech Recognition)的具體過程。通過對以上理論的研究和探索,作者設計開發(fā)了一個功能較齊全的語音軟件,它具有文本¬¬¬──語音轉換、語音校對、將文本內容保存為wav文件、語音錄入等功能,并有良好的人機交互界面。
關鍵詞:計算機語音技術;語音合成;語音識別;組件對象模型(COM)
目 錄
1 緒論 …………….……………………………………………………………….. 1
1.1 語音技術概述 ……………………………………………………………………...1
1.2 研究語音技術的重要意義 ………………………………………….……………2
2 語音技術的基礎知識 …………………………………………………………... 4
2.1 發(fā)音的生理機構與過程 ………………………………………………………….4
2.1.1 發(fā)音的生理機構 ……………………………………………………………. 4
2.1.2 語音的產(chǎn)生過程 ……………………………………………………………..4
2.1.3 語音分類 ………………………………………………………………………5
2.2 語音的基本特性 ………………………………………………………………… 6
2.2.1 語音的物理屬性 ……………………………………………………………..6
2.2.2 漢語語音基礎及其特性 ……………………………………………………6
2.2.3 語音的波形特征 ……………………………………………………………..8
2.2.4 語音的頻譜特性 ……………………………………………………………..9
2.2.5 語音的音律特性 ……………………………………………………………12
3 語音合成技術 …………………………………………………………………..13
3.1 語音合成技術簡介 ……………………………………………………………. 13
3.1.1 語音合成概述 ………………………………………………………………13
3.1.2 國內外語音合成技術的發(fā)展情況 ………………………………………13
3.2 語音合成原理 …………………………………………………………………….14
3.2.1 共振峰合成 ………………………………………………………………….15
3.2.2 LPC參數(shù) ……………………………………………………………………...17
3.2.3 PSOLA合成技術 ……………………………………………………………17
3.2.4 LMA聲道模型 ………………………………………………………………18
3.3 文本──語音轉換系統(tǒng)(Text to Speech, TTS) ……………………………19
3.3.1 TTS的發(fā)展 …………………………………………………………………..19
3.3.2 TTS的組成部分 …………………………………………………………….21
3.3.3 TTS的典型應用 …………………………………………………………….23
3.4 語音合成發(fā)展方向 ………………………………………………………………25
4 語音識別技術 ………………………………………………………………….27
4.1 語音識別技術簡介 ………………………………………………………………27
4.1.1語音識別概述 ……………………………………………………………….27
4.1.2國內外語音識別技術的發(fā)展情況 ……………………………………….29
4.2 語音識別的定義、原理和分類 …………………………………………………30
4.2.1 語音識別的定義 ……………………………………………………………30
4.2.2 語音識別的基本原理 ……………………………………………………...30
4.2.3 語音識別的分類 ……………………………………………………………31
4.3 語音識別的關鍵技術 ………………………………………………………….32
4.3.1 語音識別單元的選取 ……………………………………………………...33
4.3.2 特征參數(shù)提取技術 ………………………………………………………...33
4.3.3 模式匹配及模型訓練技術 ……………………………………………….34
4.4 語音識別的應用及發(fā)展趨勢 …………………………………………………34
4.4.1 語音識別的應用 ……………………………………………………………34
4.4.2 語音識別的發(fā)展趨勢 ……………………………………………………...35
5 語音軟件的設計和開發(fā) ………………………………………………………..38
5.1 COM簡介 ………………………………………………………………………..38
5.1.1 COM定義及COM接口 …………………………………………………..38
5.1.2 COM的基本概念 …………………………………………………………...39
5.1.3 COM對象的使用和處理 ………………………………………………….40
5.1.4 基本接口—─IUnknown ……………………………………..………….43
5.1.5 Unicode串處理 ……………………………………………………………...44
5.2 關于Microsoft Speech SDK5.1 ……………………………………………….46
5.2.1文本—語音轉換API (API for Text-to-Speech) ………………………47
5.2.2 語音識別API (API for Speech Recognition)………………………47
5.3 用VC++實現(xiàn)TTS和SR的過程 ……………………………………………..48
5.3.1 實現(xiàn)TTS的過程 ……………………………………………………………48
5.3.2 實現(xiàn)SR的過程 ……………………………………………………………..52
5.3.3 系統(tǒng)分析和測試 ……………………………………………………………54
6 結論 ……………………………………………………………………………..65
致謝
參考文獻
參考文獻
[1] 朱民雄,聞新,黃健群,周露.計算機語音技術.北京:北京航空航天大學出版社,2002年1月第一版.
[2] 張成海,張鐸.現(xiàn)代自動識別技術與應用.北京:清華大學出版社,2003年4月第一版.
[3] 康博創(chuàng)作室.Visual C++60 高級編程.北京:清華大學出版社,1997年7月第一版.
[4] Kate Gregory.Visual C++6 開發(fā)使用手冊. 機械工業(yè)出版社,1992年2月第一版.
[5] 余英,梁剛. Visual C++ 實踐與提高—COM和COM+篇.中國鐵道出版社,2001年2月第一版
[6] 潘愛民.COM原理與應用.北京:清華大學出版社,1999年11月第一版.
[7] Gregory Brill. 精通COM+[M].機械工業(yè)出版社, 黃志軍,任雄偉,劉啟忠等譯.2002年9月第一版.
[8] DON BOX.COM本質論(Essential COM).中國電力出版社,潘愛民譯,2001年8月第一版.
[9] 宋陽.利用SAPI5.0進行語素分解
[10] 約翰•斯萬科著,徐潁譯.COM編程精彩實例.中國電力出版社.2001年6月第一版.
[11] 李逸波,郭天杰,王華駒.最新語音識別技術.北京:電子工業(yè)出版社,1998
[12] 安居院猛,中嵨正之.計算機語音處理(日).北京:國防工業(yè)出版社,1987
[13] 陳永彬.語音信號處理.上海:上海交通大學出版社,1990
[14] 岳東劍,等.應用小波分析技術進行漢語語音基音頻率分析的研究.模式識別與人工智能.2000.13(2):235~237
TA們正在看...
- 高三生物第一輪復習dna結構和復制非選擇題53題(包...doc
- xx市特殊教育提升計劃實施方案.doc
- xx市礦產(chǎn)資源總體規(guī)劃(2016-2020年).doc
- xxx市國民經(jīng)濟和社會發(fā)展十三五規(guī)劃.doc
- xxx市服務業(yè)“十三五”發(fā)展規(guī)劃.doc
- xxx市工業(yè)經(jīng)濟“十三五”發(fā)展規(guī)劃.doc
- xxx市農業(yè)和農村經(jīng)濟“十三五”發(fā)展規(guī)劃.doc
- xx市交通業(yè)“十三五”發(fā)展規(guī)劃.doc
- xx市財政收支“十三五”發(fā)展規(guī)劃.doc
- “學在xx”三年行動計劃(2014—2016年).doc