內容簡介
本書對二維、三維目標檢測技術涉及的骨幹網路及入門必備的計算機視覺演算法進行全面的介紹。本書由淺入深地介紹了MNIST、ImageNet、CIFAR、波士頓房產、ModelNet等經典二維、三維數據集和相關國際賽事,還介紹了TensorFlow中的二維卷積層、全連接層、激活層、池化層、批次歸一化層、隨機失活層的演算法和梯度下降原理,AlexNet、VGG、ResNet、DarkNet、CSP-DarkNet等經典骨幹網路的設計原理,以及PointNet、GCN等三維計算機視覺神經網絡。此外,本書通過設計巧妙且具體的案例,讓讀者穩步建立紮實的編程能力,包括數據集的製作和解析、神經網絡模型設計和開銷估算、損失函數的設計、神經網絡的動態模式和靜態模式的訓練方法和過程式控制制、神經網絡的邊緣計算模型量化、神經網絡的雲計算部署。完成本書的學習,讀者可以繼續閱讀與本書緊密銜接的《深入理解計算機視覺:在邊緣端構建高效的目標檢測應用》,將所學的計算機視覺基礎知識運用到目標檢測的神經網絡設計中,對邊緣計算環境下的神經網絡進行遊刃有餘的調整。 本書適合具備一定計算機、通信、電子等理工科專業基礎的本科學生、研究生及軟體工程師閱讀,讀者需具備高等數學、線性代數、概率論、Python編程、圖像處理等基礎知識。作者簡介
張晨然,本科畢業於天津大學通信工程專業,碩士研究生階段就讀於廈門大學,主攻嵌入式系統和數字信號底層演算法,具備紮實的理論基礎。 先後就職于中國電信集團公司和福建省電子信息(集團)有限責任公司,目前擔任福建省人工智能學會的理事和企業工作委員會的主任,同時也擔任谷歌開發者社區、亞馬遜開發者生態的福州區域負責人,長期從事計算機視覺和自然語言基礎技術的研究,積累了豐富的人工智能項目經驗,致力於推動深度學習在交通、工業、民生、建築等領域的應用落地。作者於2017年獲得高級工程師職稱,擁有多項發明專利。目錄
第1篇 計算機視覺開發環境的搭建