內容簡介
影像處理和機器學習聯合用於圖像的分析和理解。影像處理借助濾波、分割、特徵提取技術實現圖像的預處理,機器學習演算法則借助分類、聚類、目標檢測技術解釋處理的資料。本書作為教材,面向影像處理領域的學生和教師,覆蓋了一些流行的影像處理方法和手段的理論基礎和實際應用。
《影像處理與機器學習》分為兩冊,本書是上冊,依次介紹影像處理的基本概念和技術,從圖元運算和它們的性質開始,探索空域濾波、邊緣檢測、二值圖分割和處理、角點檢測和直線檢測。本書為對理解影像處理核心概念和實際應用感興趣的讀者提供了堅實的理論基礎,並構建了所需的準備工作,以進一步學習下冊的內容。
本書為影像處理相關專業的教師和學生而寫,本書內容的清晰組織形式也對應用程式開發人員和工程人員具有吸引力。
作者簡介
作者:
埃裡克•奎亞斯(Erik Cuevas),墨西哥瓜達拉哈拉大學教授,墨西哥國家研究員系統成員(SNI III)。研究興趣包括元啟發式和進化演算法在影像處理和機器學習中的應用。擔任多個國際期刊編委或副主編。
阿爾瑪 納耶麗 羅德里格斯(Alma Nayeli Rodriguez),墨西哥瓜達拉哈拉大學教授。
譯者:
第一章 毓晉,清華大學教授,先後開出並講授10多門本科生和研究生課程。已在國內外發表了550多篇研究論文,已出版中英文教材、專著、工具書等60多冊。現為中國圖像圖形學學會名譽監事長、會士;國際光學工程協會(SPIE)會士(因在圖像工程方面的成就)。
目錄
第1章 圖元運算
1 1 引言
1 2 改變圖元強度值
1 2 1 對比度和照度或亮度
1 2 2 限定圖元運算的結果
1 2 3 圖像補
1 2 4 閾值分割
1 3 長條圖和圖元運算
1 3 1 長條圖
1 3 2 圖像採集特性
1 3 3 用MATLAB計算圖像的長條圖
1 3 4 彩色圖像的長條圖
1 3 5 圖元運算對長條圖的影響
1 3 6 自動對比度調整
1 3 7 累積長條圖
1 3 8 長條圖線性均衡化
1 4 伽馬校正
1 4 1 伽馬函數
1 4 2 伽馬校正的應用
1 5 MATLAB圖元操作
1 5 1 用MATLAB改變對比度和亮度
1 5 2 用MATLAB閾值化分割圖像
1 5 3 用MATLAB進行對比度
1 5 4 用MATLAB進行長條圖均衡化
1 6 多源圖元運算
1 6 1 邏輯和算數運算
1 6 2 Alpha混合運算
參考文獻
第2章 空域濾波
2 1 引言
2 2 什麼是濾波器
2 3 空域線性濾波器
2 3 1 濾波器矩陣
2 3 2 濾波操作
2 4 MATLAB中濾波操作的計算
2 5 線性濾波器的類型
2 5 1 平滑濾波器
2 5 2 “盒”濾波器
2 5 3 高斯濾波器
2 5 4 差分濾波器
2 6 線性濾波器的形式特徵
2 6 1 線性卷積和相關
2 6 2 線性卷積性質
2 6 3 濾波器的可分離性
2 6 4 濾波器的脈衝回應
2 7 用MATLAB對圖像加雜訊
2 8 空域非線性濾波器
2 8 1 最大值和最小值濾波器
2 8 2 中值濾波器
2 8 3 具有多重性窗口的中值濾波器
2 8 4 其他非線性濾波器
2 9 MATLAB中的線性空域濾波器
2 9 1 相關尺寸和卷積
2 9 2 處理圖像邊框
2 9 3 實現線性空域濾波器的MATLAB函數
2 9 4 實現非線性空域濾波器的MATLAB函數
2 10 二值濾波器
參考文獻
第3章 邊緣檢測
3 1 邊緣和輪廓
3 2 用基於梯度的技術檢測邊緣
3 2 1 偏導數和梯度
3 2 2 匯出的濾波器
3 3 邊緣檢測濾波器
3 3 1 蒲瑞維特運算元和索貝爾運算元
3 3 2 羅伯特運算元
3 3 3 羅盤運算元
3 3 4 用MATLAB檢測邊緣
3 3 5 用於邊緣檢測的MATLAB函數
3 4 基於二階導數的運算元
3 4 1 使用二階導數技術的邊緣檢測
3 4 2 圖像的銳化增強
3 4 3 用MATLAB實現拉普拉斯濾波器和增強銳度
3 4 4 坎尼濾波器
3 4 5 實現坎尼濾波器的MATLAB工具
參考文獻
第4章 二值圖分割和處理
4 1 引言
4 2 分割
4 3 閾值化
4 4 最優閾值
4 5 大津演算法
4 6 用區域生長分割
4 6 1 初始圖元
4 6 2 局部搜索
4 7 二值圖中的目標標記
4 7 1 暫時標記目標(步驟1)
4 7 2 標記的傳播
4 7 3 相鄰標記
4 7 4 解決衝突(步驟2)
4 7 5 用MATLAB實現目標標記演算法
4 8 二值圖中的目標邊界
4 8 1 外輪廓和內輪廓
4 8 2 輪廓識別和目標標記的結合
4 8 3 MATLAB實現
4 9 二值目標的表達
4 9 1 長度編碼
4 9 2 鏈碼
4 9 3 差分鏈碼
4 9 4 形狀數
4 9 5 傅里葉描述符
4 10 二值目標的特徵
4 10 1 特徵
4 10 2 幾何特徵
4 10 3 周長
4 10 4 面積
4 10 5 緊湊度和圓度
4 10 6 圍盒
參考文獻
第5章 角點檢測
5 1 圖像中的角點
5 2 哈裡斯演算法
5 2 1 結構矩陣
5 2 2 結構矩陣的濾波
5 2 3 本征值和本征向量的計算
5 2 4 角點值函數(V)
5 2 5 角點的確定
5 2 6 演算法實現
5 3 用MATLAB確定角點位置
5 4 其他角點檢測器
5 4 1 博代檢測器
5 4 2 基爾希和羅森菲爾德檢測器
5 4 3 王和布萊迪檢測器
參考文獻
第6章 直線檢測
6 1 圖像中的結構
6 2 哈夫變換
6 2 1 參數空間
6 2 2 累積記錄矩陣
6 2 3 參數化模型改變
6 3 哈夫變換的實現
6 4 在MATLAB中程式設計實現哈夫變換
6 5 用MATLAB函數檢測直線
參考文獻
前言/序言
影像處理是一個重要的研究領域,因為它能改善和操縱各種應用中的圖像,如在分析和診斷中起著重要作用的X射線、CT掃描和MRI圖像等醫學影像。影像處理演算法可以用於監控系統,以檢測和跟蹤物體,增強圖像品質,並進行面部識別。在遙感中,影像處理技術用於分析各種情況下的衛星和航空圖像,以實現環境監測和資源管理等目的。在多媒體
系統,如照片編輯軟體和視頻遊戲中,它應用于增強和操縱圖像顯示。總體而言,影像處理具有廣泛的應用,並已成為許多行業的關鍵工具,這使其成為一個重要的研究領域。
機器學習(ML)是人工智慧的一個研究領域,它允許在沒有明確程式設計的情況下從資料中學習並做出預測或決策。例如,在自動化領域中ML演算法可以自動完成原本需要人工干預的任務,減少錯誤並提高效率; 在預測分析中,ML模型可以分析大量資料,以識別模式並進行預測,這可以用於各種應用,如股市分析、欺詐檢測和客戶行為分析; 在決策中,ML演算法可以根據資料提供見解和建議,幫助機構做出更好、更明智的決策。
影像處理和機器學習的結合涉及使用兩個領域的技術來分析和理解圖像。影像處理技術用於對圖像進行預處理,如濾波、分割和特徵提取,而ML演算法用於分析和解釋處理後的資料,如分類、聚類和目標檢測。目的是利用每個領域的優勢構建電腦視覺系統,在無須人工干預的情況下自動分析和理解圖像。通過這種組合,影像處理技術可以提高圖像的品質,從而提高ML演算法的性能。ML演算法可以自動分析和解釋圖像,這可減少手動干預。
我們的主要目標是編寫一本全面的教科書,將之作為影像處理課程的有用資源。為此,我們精心安排內容,涵蓋了流行影像處理方法的理論基礎和實際應用。從圖元運算到幾何變換,從空間濾波到圖像分割,從邊緣檢測到彩色影像處理,完全涵蓋了處理和理解圖像所必需的廣泛主題。此外,因為認識到ML在影像處理中日益增強的相關性,所以引入了基本的ML概念及其在該領域的應用。通過介紹這些概念,旨在為讀者提供必要的知識,利用ML技術執行各種影像處理任務。我們的最終願望是讓全書成為學生和從業者的有用工具,讓他們對影像處理的基本原理有一個扎實的理解,並能夠在現實世界中應用這些技術。
為了涵蓋所有重要資訊,有必要包括許多章 節 和程式。因此,全書包含了大量的內容和程式設計示例。然而,一本包含多個章 節 和程式的單冊書可能會讓讀者應接不暇,因此我們決定將全書分為兩冊。進行拆分的主要目的是確保讀者恰當地處理和理解全書內容。通過將內容分為兩冊,使得全書變得更容易理解和使用,防止讀者被巨量資訊所淹沒。這種深思熟慮的劃分有助於獲得更順暢的學習體驗,使讀者能夠更有效地流覽和深入研究內容,並以自己的節 奏掌握概念和技術。總的來說,將全書分為兩冊的決定旨在優化讀者對本書提供的大量材料和程式的理解效果和參與感。
為了確保讀者能夠有效地流覽和領悟全書內容,我們決定將其分為兩冊: 上冊為《影像處理基礎》,下冊為《圖像分析和機器學習》。
上冊涵蓋了影像處理的基本概念和技術,包括圖元操作、空間濾波、邊緣檢測、圖像分割、角點檢測和幾何變換。它為讀者理解影像處理的核心原理和實際應用奠定了堅實的基礎。通過重點關注上冊的6章 內容,可為對該領域的進一步探索奠定必要的基礎。在從上冊獲得的知識的基礎上,下冊更多關注圖像分析的內容。它涵蓋了一系列主題,包括形態濾波器、彩色影像處理、幾何變換、圖像匹配識別、基於特徵使用均移演算法的分割以及奇異值分解(SVD)在圖像壓縮中的應用。除了介紹影像處理的先進概念和技術外,下冊還提供了應用於該領域的幾種重要的ML技術。因為認識到ML在圖像分析中日益重要的意義,並瞭解其在增強影像處理任務方面的潛力,下冊引入了相關的ML方法。
將全書分為兩冊,使得每一冊都能單獨作為獨立的、自包含的資源,這意味著讀者可以靈活地獨立學習或溫習每一冊的內容,而不必依賴另一冊的上下文或理解。通過保持獨立的結構,讀者可以按模組化的方式處理材料,根據需要關注特定方面或重新閱讀特定章 節 。
上冊介紹影像處理的基本概念和技術。它為理解影像處理的核心原理和實際應用奠定了基礎。通過關注這些基本主題,上冊旨在讓讀者對影像處理的核心概念和基本技術有一個扎實的理解。它構成了在下冊中進一步探索更深入主題和ML應用程式的基礎。無論你是該領域的學生還是從業者,上冊都將為你提供必要的知識,使你能夠自信地領會和完成影像處理任務。
許多關於影像處理技術的書籍都是面向具有強大數學背景的讀者的。在回顧了各種相關書籍後,作者注意到需要對這些主題採取更通用、技術性較低的方法,以吸引更廣泛的讀者和學生。全書包含了其他類似書籍中的所有主題,但更強調解釋、實踐和使用方法,而較少強調數學細節 。
全書不僅涵蓋了影像處理的關鍵概念和技術,還提供了大量的代碼和實現。作者認為這是本書的一個重要特點。即使是那些數學能力很強的讀者,當他們在代碼中看到它之前,也很難完全掌握一種特定的方法。通過在代碼中實現演算法和方法,可消除混淆或不確定性,使技術更容易理解和傳播。採用這種方式,當讀者在書中從較簡單的方法進展到更複雜的方法時,對計算(實現的代碼)的關注使他們能夠看懂各種模型,並加強他們的數學理解。
許多類似的書只關注理論內容,而那些涵蓋實際實現的書通常提供了從頭開始的開發演算法的通用方法。教學經驗表明,當學生能夠訪問他們可以實驗和修改的代碼時,他們會更快地理解書中的內容。全書使用