內容簡介
影像處理和機器學習聯合用於圖像的分析和理解。影像處理借助濾波、分割、特徵提取技術實現圖像的預處理,機器學習演算法則借助分類、聚類、目標檢測技術解釋處理的資料。本書作為教材,面向影像處理領域的學生和教師,覆蓋了一些最流行的影像處理方法和手段的理論基礎和實際應用。
全書分為兩冊,本書為下冊,依次介紹影像處理更先進的概念和技術,包括形態學濾波器、彩色影像處理、圖像中的幾何操作、圖像匹配、基於特徵使用均移演算法的分割和奇異值分解在圖像壓縮中的應用。下冊在上冊介紹的基礎知識之上,結合了若干應用於影像處理的重要機器學習技術。
本書為影像處理相關專業的教師和學生而寫,本書內容的清晰組織形成也對應用程式開發人員和工程人員具有吸引力。
作者簡介
作者:
埃裡克•奎亞斯(Erik Cuevas),墨西哥瓜達拉哈拉大學教授,墨西哥國家研究員系統成員(SNI III)。研究興趣包括元啟發式和進化演算法在影像處理和機器學習中的應用。擔任多個國際期刊編委或副主編。
阿爾瑪 納耶麗 羅德里格斯(Alma Nayeli Rodriguez),墨西哥瓜達拉哈拉大學教授。
譯者:
第一章 毓晉,清華大學教授,先後開出並講授10多門本科生和研究生課程。已在國內外發表了550多篇研究論文,已出版中英文教材、專著、工具書等60多冊。現為中國圖像圖形學學會名譽監事長、會士;國際光學工程協會(SPIE)會士(因在圖像工程方面的成就)。
目錄
第1章 形態學運算
1 1 結構的縮小和增大
1 2 基本形態學運算
1 2 1 參考結構
1 2 2 點集
1 2 3 膨脹
1 2 4 腐蝕
1 2 5 膨脹和腐蝕的性質
1 2 6 形態學濾波器的設計
1 3 二值圖像中的邊緣檢測
1 4 形態學運算的組合
1 4 1 開啟
1 4 2 閉合
1 4 3 開啟和閉合運算的性質
1 4 4 擊中-擊不中變換
1 5 灰度圖像的形態學濾波器
1 5 1 參考結構
1 5 2 灰度圖像的膨脹和腐蝕
1 5 3 灰度圖像的開啟和閉合
1 5 4 高帽變換和低帽變換
1 6 形態學運算的MATLAB函數
1 6 1 斯太爾函數
1 6 2 用於膨脹和腐蝕的MATLAB函數
1 6 3 涉及開啟和閉合操作的MATLAB函數
1 6 4 成功或失敗的變換(擊中-擊不中)
1 6 5 函數bwmorph
1 6 6 凸分量的標記
參考文獻
第2章 彩色圖像
2 1 RGB圖像
2 1 1 彩色圖像的組合
2 1 2 全色圖像
2 1 3 索引圖像
2 2 RGB圖像的長條圖
2 3 彩色模型和彩色空間轉換
2 3 1 將RGB圖像轉換為灰度圖像
2 3 2 沒有彩色的RGB圖像
2 3 3 減少彩色圖像的飽和度
2 3 4 HSV和HSL彩色模型
2 3 5 從RGB到HSV的轉換
2 3 6 從HSV到RGB的轉換
2 3 7 從RGB到HSL的轉換
2 3 8 從HSL到RGB的轉換
2 3 9 HSV和HSL模型的比較
2 4 YUV、YIQ和YCbCr彩色模型
2 4 1 YUV模型
2 4 2 YIQ模型
2 4 3 YCbCr模型
2 5 用於列印圖像的有用彩色模型
2 5 1 從CMY到CMYK的變換(版本1)
2 5 2 從CMY到CMYK的變換(版本2)
2 5 3 從CMY到CMYK的變換(版本3)
2 6 色度模型
2 6 1 CIEXYZ彩色空間
2 6 2 CIE色度圖
2 6 3 照明標準
2 6 4 色度適應
2 6 5 色域
2 7 CIE彩色空間的變型
2 8 CIE的L*a*b*模型
2 8 1 從CIEXYZ到L*a*b*的變換
2 8 2 從L*a*b*到CIEXYZ的變換
2 8 3 確定彩色差別
2 9 sRGB模型
2 10 彩色影像處理的MATLAB函數
2 10 1 處理RGB和索引圖像的函數
2 10 2 彩色空間轉換的函數
2 11 彩色影像處理
2 12 線性彩色變換
2 13 彩色圖像的空域處理
2 13 1 彩色圖像平滑
2 13 2 用MATLAB平滑彩色圖像
2 13 3 彩色圖像的銳化增強
2 13 4 用MATLAB銳化彩色圖像
2 14 彩色圖像的向量處理
2 14 1 彩色圖像中的邊緣檢測
2 14 2 用MATLAB檢測彩色圖像中的邊緣
參考文獻
第3章 圖像幾何運算
3 1 座標變換
3 1 1 簡單變換
3 1 2 齊次座標
3 1 3 仿射變換(三角變換)
3 1 4 投影變換
3 1 5 雙線性變換
3 1 6 其他非線性幾何變換
3 2 座標重賦值
3 2 1 源-目標映射
3 2 2 目標-源映射
3 3 插值
3 3 1 簡單插值方法
3 3 2 理想插值
3 3 3 立方插值
3 4 混疊
3 5 MATLAB中的幾何變換函數
參考文獻
第4章 圖像比較和識別
4 1 灰度圖像的比較
4 1 1 模式間的距離
4 1 2 距離和相關
4 1 3 歸一化的互相關
4 1 4 相關係數
4 2 利用相關係數的模式識別
4 3 二值圖像的比較
4 3 1 距離變換
4 3 2 斜面演算法
4 4 斜面指標
參考文獻
第5章 用於分割的均移演算法
5 1 引言
5 2 核密度估計(KDE)和均移方法
5 3 密度吸引子點
5 4 連續自我調整均移分割
5 4 1 特徵定義
5 4 2 操作資料集
5 4 3 MS演算法的操作
5 4 4 包含非活動資料
5 4 5 合併非代表性聚類
5 4 6 計算過程
5 5 分割過程的結果
5 5 1 實驗設置
5 5 2 性能指標
5 5 3 比較結果
參考文獻
第6章 影像處理中的奇異值分解
6 1 引言
6 2 計算SVD元素
6 3 資料集的近似
6 4 SVD用於圖像壓縮
6 5 主分量分析
6 6 協方差主分量
6 7 相關主分量
參考文獻
前言/序言
影像處理具有重要意義,因為它能夠增強和處理各個領域的圖像。影像處理發揮關鍵作用的一個突出領域是醫學成像。在這裡,它對醫學圖像的分析和診斷做出了重大貢獻,包括X射線、CT掃描和MRI圖像。通過使用影像處理技術,醫療保健專業人員可以提取有價值的資訊,實現更準確的診斷和治療計畫。監控系統也嚴重依賴影像處理演算法。這些演算法有助於物體檢測、跟蹤和圖像品質的提高,從而提高監視操作的有效性。此外,影像處理演算法支援面部識別,增強了各種應用中的安全措施。遙感應用也極大地受益於影像處理技術。通過使用這些技術,可以分析衛星和航空圖像,以監測環境、管理資源,並為科學研究和決策提供有價值的見解。多媒體應用程式,包括照片編輯軟體和視頻遊戲,利用影像處理來增強和操縱圖像,以獲得最佳顯示品質。這些應用程式利用演算法來調整亮度、對比度、顏色和其他視覺屬性,可增強使用者的視覺體驗。
機器學習(ML)是人工智慧(AI)的一個分支,它使系統能夠從資料中學習,並在不需要常規程式設計的情況下做出明智的預測或決策。ML在各個領域都有廣泛的應用。例如,在自動化中,ML演算法可以自動地執行原本依賴人工干預的任務,從而減少錯誤並提高整體效率。預測分析是ML發揮關鍵作用的另一個領域。通過分析龐大的資料集,ML模型可以檢測模式並進行預測,推動股市分析、欺詐檢測和客戶行為分析等應用。ML也有助於決策過程,因為它的演算法基於資料提供了有價值的見解和建議,幫助機構做出更明智和優化的決策。總體來說,ML是人工智慧中一個強大的領域,為自動化任務、生成預測和支援各個領域的決策過程提供了巨大的潛力。
影像處理和機器學習的集成利用兩個領域的技術來分析和理解圖像。採用影像處理技術,包括濾波、分割和特徵提取,對圖像進行預處理。隨後,ML演算法開始發揮作用,通過分類、聚類和目標檢測等任務來分析和解釋處理後的資料。最終目標是利用每個領域的優勢,構建能夠在無須人工干預的情況下自主分析和理解圖像的電腦視覺系統。這種融合允許影像處理技術提高圖像品質,從而提高ML演算法的性能。同時,ML演算法使圖像的分析和解釋自動化,從而減少了對人工干預的依賴。通過將這兩個領域結合起來,實現了強大的協同作用,從而開發出穩健高效的圖像分析和理解系統。
我們的主要目標是編寫一本全面的教科書,將之作為影像處理課程的有用資源。為此,我們精心安排內容,涵蓋了流行影像處理方法的理論基礎和實際應用。從圖元運算到幾何變換,從空間濾波到圖像分割,從邊緣檢測到彩色影像處理,完全涵蓋了處理和理解圖像所必需的廣泛主題。此外,因為認識到ML在影像處理中日益增強的相關性,所以引入了基本的ML概念及其在該領域的應用。通過介紹這些概念,旨在為讀者提供必要的知識,利用ML技術執行各種影像處理任務。我們的最終願望是讓全書成為學生和從業者的有用工具,讓他們對影像處理的基本原理有一個扎實的理解,並能夠在現實世界中應用這些技術。
為了涵蓋所有重要資訊,有必要包括許多章 節 和程式。因此,全書包含了大量的內容和程式設計示例。然而,一本包含多個章 節 和程式的單冊書可能會讓讀者應接不暇,因此我們決定將全書分為兩冊。進行拆分的主要目的是確保讀者恰當地處理和理解全書內容。通過將內容分為兩冊,使得全書變得更容易理解和使用,防止讀者被巨量資訊所淹沒。這種深思熟慮的劃分有助於獲得更順暢的學習體驗,使讀者能夠更有效地流覽和深入研究內容,並以自己的節 奏掌握概念和技術。總的來說,將全書分為兩冊的決定旨在優化讀者對本書提供的大量材料和程式的理解效果和參與感。
為了確保讀者能夠有效地流覽和領悟全書內容,我們決定將其分為兩冊: 上冊為《影像處理基礎》,下冊為《圖像分析和機器學習》。
上冊涵蓋了影像處理的基本概念和技術,包括圖元操作、空間濾波、邊緣檢測、圖像分割、角點檢測和幾何變換。它為讀者理解影像處理的核心原理和實際應用奠定了堅實的基礎,並為該領域的進一步探索奠定了必要的基礎。在從上冊獲得的知識的基礎上,下冊更多關注圖像分析中更深入的內容,包括形態濾波器、彩色影像處理、幾何變換、圖像匹配識別、基於特徵使用均移(MS)演算法的分割,以及奇異值分解(SVD)在圖像壓縮中的應用。此外,下冊還結合了應用於影像處理的幾種重要ML技術。認識到ML在圖像分析中日益增長的重要性及其增強影像處理任務的潛力,下冊中整合了相關的ML方法。綜合性的下冊擴展了上冊的基礎知識,使讀者能夠深入研究影像處理的更複雜方面,同時也融入了ML技術的力量。
將全書分為兩冊,使得每一冊都能單獨作為獨立的、自包含的資源,這意味著讀者可以靈活地學習或溫習每一冊的內容,而不必依賴另一冊的上下文或理解。通過獨立的結構使讀者能夠採用模組化的方法,根據需要關注特定主題或重新閱讀特定章 節 。這一劃分,讀者能夠根據個人需求和偏好靈活地使用全書,增強他們的學習體驗,並促進對內容的更有針對性的探索。
基於從上冊獲得的基礎知識,下冊探討圖像分析中更深入的主題,以及這些主題與ML強大技術之間的相互關係。除了這些深入的影像處理概念和技術外,下冊還探討了ML技術在圖像分析中的集成。認識到ML在該領域日益增長的重要性,本冊中納入了相關的ML方法。通過理解和應用這些ML技術,可以解鎖圖像分析的新維度,並增強影像處理工作流的功能。
在回顧了大量考慮影像處理技術和ML概念的書籍後,作者發現它們的一個共同