內容簡介
本書共3篇,12章,內容涵蓋了深度學習的基礎理論、重要模型及其在計算機視覺和自然語言處理等領域的應用。第1篇深入講解了深度學習的基礎理論,包括感知機的主要概念及其實現、神經網絡的架構與算法,以及參數更新策略、權重初始化方法和正則化技巧。第2篇專註于計算機視覺,介紹了卷積神經網絡的結構及其在圖像處理方面的廣泛應用,同時探討了經典的卷積網絡結構以及先進網絡在物體檢測與圖像分割等領域的應用。第3篇著眼于自然語言處理,涵蓋了語言模型、word2vec模型、RNN模型及其變體、Transformer模型以及預訓練模型在多種任務中的應用。 本書在專業性與可讀性之間實現了良好的平衡,不僅向讀者提供深度學習領域的綜合知識和實際技能,還致力於激發讀者的創新思維和實踐能力,助力讀者在快節奏發展的技術環境中掌握先機,取得更高成就。 本書既可作為高等院校深度學習課程的基礎教材,也適合深度學習愛好者進行自學。無論是初學者還是具有一定基礎的從業人員,都能從中獲得啟發和實用的知識。目錄
前言