內容簡介
本書系統地介紹了語音識別的原理與應用。全書共15章,原理部分涵蓋聲學特徵、隱馬爾可夫模型(HMM)、高斯混合模型(GMM)、深度神經網絡(DNN)、語言模型和加權有限狀態轉換器(WFST),重點描述了GMM-HMM、DNN-HMM和端到端(E2E)三種語音識別框架;應用部分包含Kaldi、ESPnet、WeNet和工業應用實踐介紹,內容主要來自工程經驗,極具實用性。 本書可以作為普通高等學校人工智能、計算機科學與技術、電子信息工程、自動化等專業的本科生及研究生的教材,也適合作為從事智能語音系統的科研人員和工程技術人員的參考書。作者簡介
李琳,廈門大學副教授,主要研究方向為語音信號處理、聲紋識別、智能系統設計,負責國家重點研發項目子課題一項、省級科研項目一項,作為第一合作者參与國家自然基金兩項,參与指導Xmuspeech團隊連續兩屆獲東方語種識別競賽第一名。國際IEEE學會會員,NCMMSC常設機構委員會委員,CCF語音對話與聽覺專業組委員。目錄
第1章 語音識別概論