內容簡介
近年來人工智能技術突飛猛進,以語音識別為代表的音頻處理技術取得了大量突破,但該領域內理論結合實戰的入門書籍卻較為缺乏,本書旨在為有志學習音頻信號處理的讀者提供一本實用的入門書籍。 本書共13章,第1章和第2章是基礎部分,包括聲學基礎知識及Python基礎等內容;第3到4章介紹了音頻信號的獲取及分析方法;第5~8章介紹了語音識別基礎、傳統語音識別技術及語音識別、語音合成的實戰技術;第9章和第10章介紹了常用的音樂分析方法及Python編曲等內容;第11~13章介紹了深度學習的基礎知識及如何用PyTorch對語音和音樂信號進行分析處理。 本書以通俗易懂的語言、圖文並茂的講解力圖使讀者在短時間內掌握音頻信號處理的基本技術。本書既可供包括高校學生在內的各類初學者快速入門、也可供該領域的專業技術人員及愛好者參考。作者簡介
姚利民,畢業於東南大學,長期在外資企業從事管理工作,同時致力於A0及圖像處理的研究。2012年赴某知名跨國企業全球總部工作,回國后自主創業。目前主要從事A0研究,專攻棋類博弈和計算機視覺。有感於相關資源的匱乏,主講基於Java的OpenCV課程,短期內獲大量關注。目錄
本書源碼