目錄
第一章 緒論
1 1研究背景和意義
1 2國內外現狀
1 3本書主要思路及創新
1 4本書主要研究內容和結構
第二章 屬性約簡理論介紹
2 1屬性約簡及其相關知識
2 2屬性約簡的主要方法
2 3關係決策系統及其屬性約簡
2 4本章 小結
第三章 決策表中約簡算法的拓展
3 1變精度模型
3 2變精度約簡算法
3 3近似分類精度約簡
3 4本章 小結
第四章 帶權決策表模型
4 1帶權決策表模型
4 2帶權決策表中正域約簡
4 3帶權決策表中變精度約簡
4 4帶權決策表中變精度約簡的優化
4 5實驗對比分析
4 6本章 小結
第五章 相對不可區分關係和相對區分關係
5 1 關係系統中關係集合的定義
5 2關係決策系統中的相對不可區分關係定義及其約簡
5 3關係決策系統中的相對區分關係定義及其約簡
5 4實驗分析
5 5本章 小結
第六章 屬性約簡在兼類詞詞性標注中的應用
6 1語料採集及其預處理過程
6 2屬性約簡後的規則集
6 3實驗分析
6 4本章 小結
第七章 後繼工作展望
參考文獻
後記
前言/序言
屬性約簡是機器學要內容,一直以來廣受國內外學界的關注。屬性約簡是在特定規則的前提下,刪除決策表中冗餘的條件屬性或者不相關的條件屬性後,在保持知識分類能力不變的情況下,來得到條件屬性集合的小子集。根據約簡類型的不同定義,存在不同的算法,從而可以得到約簡後的結果。因此,該理論的應用具有十分重要的意義。
本書首先介紹了有關屬性約簡的基本知識。在決策表中,根據對變精度約簡和正域約簡兩種約簡類型的比較發現,在精度值一定的條件下,通過更新部分對象的決策值,可以將變精度約簡問題轉化為正域約簡問行處理,並給出了有關證明過程而提出了一種將變精度約簡轉化為正域約簡的方法。此方法的創新性在於可以得到約簡後的全部結果。同時在決策表中,根據上近似和下近似的有關定義,提出了近似分類精度約簡的定義,並且提出了相應的辨識矩陣而提出了基於辨識矩陣的近似分類精度約簡的算法。
其次,利用決策表中決策規則的相同性和差異性,加入了新的元素,從而對決策行了初步的推廣,並且提出了帶權決策表模型。在帶權決策表中一步研究了變精度約簡和正域約簡的問題,討論了兩者之間存在的聯繫。考慮到在一定的精度條件下,利用更新帶權決策表中部分決策值的方法,也可以將變精度約簡轉化為正域約行計算,從而提出了帶權決策表中關於變精度約簡的算法。除此之外,分析了關於決策表和帶權決策表的正域約簡問題。
再次,在原有二元關係為等價關係的基礎上,將等價關係推廣為一般關係,即二元關係不要求具有任何性質,由此二元關係形成了關係系統和關係決策系統。在關係決策系統中,提出了相對不可區分關係和相對區分關係的兩個概念,提出了兩者約簡的有關概念,提出了相應的辨識矩陣,並且給出了形式化的數學證明過程。由此,提出了基於辨識矩陣的相對不可區分關係約簡和相對區分關係約簡的有關算法。除此之外,根據關係決策系統中有關約簡的定義,由二元關係及其補關係的討論,可以得到基於約簡的相對不可區分關係和相對區分關係的兩個約簡算法。
後,針對兼類詞詞性的標注問題,含兼類詞的語句轉化為離散化的決策表後,利用關係決策系統中二元關係所具有的一般性,結合屬性約簡過程,刪除上下文中冗餘或者不相關位置的信息,得到了關於兼類詞的上下文位置信息。根據得到的有關兼類詞詞性的決策規則對兼類詞的詞行標注,並且對行了實驗驗證。
由於作者水平有限,加之時間倉促,書中難免有不當之處,敬請各位同行批評指正。
摘要
第一章 緒論
1 1研究背景和意義
世紀80年代,波蘭學者帕拉克(Pawlak)等研究人員對信息系統的邏輯特行了深入研究和廣泛探討,並在此基礎上提出了屬性約簡理論。”信息數據量的急劇增加,以及人類活動的主觀參與增加的數據噪聲,顯著了數據研究的複雜性。為了在海量的信息數據中挖掘潛在的知識、發現必要的知識,這就對信息數據分析及處理工作提出了更高的要求。其中,所涉及的粗糙集理論是一種關於不、不確定性數據的表達、學理的數據分析理論,其分類方法的主要思想是根據現有知識分類刻畫或描述知識庫中潛在的未知知識,其大優點是無須提供任何先驗信息就可以描述或表達必要的客觀知識。例如,把操場中所有的圓球作為集合,此的圓球都有顏色屬性(紅色、黃色、藍色等三種顏色)、型號屬性(大、中、小等三種型號)、用途屬性(籃球、排球、網球等三種球類)。當把用途作為知識時,可以對該集行關於用途的劃分,也可以將顏色、型號作為知識對集行劃分。在一般情況下,當主觀需要的屬性不同時,通常意義上由其在集合上誘導的劃分也不同。由以上三種屬性所確定的分行交運算後就形成了基本知識庫,並且建立了有效的知識分類。在知識庫中,關於對知識的描述則形成了近似(上近似、下近似)的概念。粗糙集理論技術是數據挖掘及處理的有效手段,而屬性約簡理論也正受到廣大科研工作者關注。隨著屬性約簡理論的不斷發展,近四十年來其光輝成遍佈在機器學程控制、故障診斷、衛生服務等領域的研究中。
在粗糙集研究中,所涉及的公理化方法可以更透徹地理解為近似算子的代數結構。P 3)通過將外積運算引入粗糙集”,給出了關於經典粗糙集和模糊粗糙集統一下的近似公理化刻畫。同時,根據上近似和下近似互為對偶,也給出了經典粗糙集和模糊粗糙集的統一的上近似公理化刻畫。孫輝等人給粗糙集公理行了嚴格證明,刻畫了更精練的獨立性公理集。6若不限制論域的基,有學者僅用一條公理來分別刻畫由自反關係、對稱關係、傳遞關係所決定的近似。同時,還可以僅使用一個公理刻畫經典粗糙集的上、下近似。屬性約簡理論的發展與其他理論相得益彰,了各個領域向著縱深。例如,證據理論7 8、形式概念分析19 10、粒計算(1-3]、拓撲描述近似空間4等。
屬性約簡的應用涉及規則獲取、智能算法等多方面的研究,一步的研究拓展主要是從構造方法方面入手。構造方法的研究主要是利用雙論域、關係推廣、概率論、模糊集合論等的方法而形成廣義粗糙集。例如,將隸屬於一個論域的對象間的二元關係延伸到雙論域上。(1S)在關係的推廣上,為打破等價關係上的限制,有學者提出了經推廣後的二元關係。例如,僅需要滿足等價性質和相似性質的優勢關係;僅需滿足等價性質和對稱性質的容差關係”和限制容差關係(即在滿足等價性質和對稱性質的基礎上,設置兩個數值之間閾值的小參數)18;在滿足等價性質和相似性質兩者的基礎上,設置兩個數值之間閾值的小參數,即限制優勢關係(%);在滿足等價關係的基礎上,保證相似關係成立,即相似關係2D;不要求具有任何關係性質的一般關係1 2);等等。上述二元關係均是在屬性集合中通過對屬行誘導得到的,並利用得到的二元關係的性質對行再次推廣,從而定義了廣義粗糙集模型。有學者用逆概率描述粗糙集,提出了粗糙貝葉斯模型,並將粗糙貝葉斯模型與變精度粗糙集模型的對應關行了闡述。(2)有學者在粗糙集中引入貝葉斯決策理論給出了近似的概念。24顯然,在經典粗糙集理論中,關於等價關係下成立的性質已不再適用於該模型。模糊集是美國學者拉特飛 紮德(LotfiA Zadeh)於1965年提出的,主要描述對象之間的隸屬關係。粗糙集和模糊集兩者之間存在天然的互補性,可以結合模糊集的特點,使用隸屬度來拓展有關近似的刻畫。在一般情況下,在廣義粗糙集
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。