目錄
目錄
第二版序
第1版序
第二版前言
第1版前言
第1章 緒論 1
第1節 基因組及基因組學概念 1
一、基因組基本概念 1
二、基因組學及其技術概述 3
三、基因組學發展簡史 5
第二節 植物基因組特徵與測序 8
一、植物基因組特徵 8
二、植物基因組測序歷史及其進展 11
第三節 植物基因組學展望與挑戰 13
一、植物基因組學研究展望 13
二、植物基因組研究面臨的挑戰 14
第2章 植物基因組測序與拼裝 16
第1節 基因組調查與測序 16
一、細胞遺傳學分析 16
二、基因組調查測序與K-mer分析 18
三、植物基因組測序 20
第二節 植物基因組拼接組裝 23
一、基因組拼接 23
二、染色體水平組裝 26
第3章 植物基因組構成與注釋 28
第1節 植物基因組大小與基本結構 28
一、植物基因組大小 28
二、植物基因組基本結構 30
第二節 植物基因組主要構成因子與鑒定 31
一、蛋白質編碼基因 31
二、非編碼RNA 36
三、重複序列 43
第4章 植物基因組轉錄 47
第1節 轉錄組概述 47
一、轉錄組及其測定 47
二、基因轉錄水平分析 49
第二節 植物基因組轉錄特徵 50
一、植物轉錄本構成及其特徵 50
二、編碼基因轉錄水平變化 52
三、非編碼RNA轉錄水平變化 54
第5章 植物基因組甲基化修飾 56
第1節 植物基因組甲基化特徵及測定 56
一、植物基因組甲基化特徵 56
二、基因組甲基化測定 57
第二節 植物基因組甲基化的分子機制與功能 60
一、植物基因組甲基化的分子機制 60
二、植物基因組甲基化的生物學功能 62
第6章 植物基因組進化 66
第1節 植物基因組保守性與變異 66
一、植物基因組保守性與進化 66
二、植物基因組複製及其變異機制 71
第二節 基因組多倍化 75
一、基因組片段倍增 75
二、基因組多倍化方式 77
三、基因組多倍化後二倍化過程 81
第三節 其他基因組進化機制 84
一、橫向基因轉移 84
二、B染色體和環狀DNA 86
第7章 植物群體基因組 92
第1節 群體基因組學概述 92
一、群體基因組變異與進化分析 92
二、基因組選擇信號檢測方法 94
三、泛基因組分析 96
第二節 自然群體基因組特徵與自然選擇 97
一、自然群體基因組變異與進化 97
二、自然選擇位點及其特徵 100
第三節 作物群體基因組特徵與人工選擇 103
一、人工選擇對作物基因組的影響 103
二、作物群體結構及其人工選擇和遺傳漸滲 107
三、作物泛基因組 111
第8章 植物單細胞基因組 114
第1節 單細胞組學概述 114
一、單細胞及其組學研究 114
二、單細胞組學關鍵技術 115
第二節 植物單細胞組學研究 116
一、植物單細胞組學研究狀況 116
二、植物單細胞組學展望 121
第9章 植物三維基因組 123
第1節 三維(3D)基因組學概述 123
一、三維基因組及其檢測技術 123
二、三維基因組學分析技術 128
第二節 植物三維基因組結構與分析 134
一、植物三維基因組結構 135
二、植物三維基因學分析 138
第10章 植物合成基因組 143
第1節 合成生物學概述 143
一、合成生物學概念及其技術 143
二、植物合成基因組意義與展望 148
第二節 植物基因組設計與合成 149
一、植物次生代謝途徑人工合成 150
二、光合途徑與高光效植物創制 152
三、植物底盤基因組 154
第11章 植物細胞器基因組 157
第1節 細胞器基因組概述 157
一、葉綠體基因組 157
二、線粒體基因組 161
第二節 細胞器基因組特徵與利用 166
一、葉綠體基因組 166
二、線粒體基因組 170
第12章 植物功能基因挖掘技術 177
第1節 基於群體的基因挖掘技術 177
一、基於雙親群體的基因挖掘技術 177
二、基於自然群體的基因挖掘技術 180
第二節 基於遺傳網絡的基因挖掘技術 182
一、基因調控與共表達網絡 182
二、蛋白質互作網絡 186
三、多組學整合網絡 188
第13章 植物功能基因組學技術 190
第1節 基因的突變與表達操控 190
一、突變體庫的構建與分析 190
二、基因表達的操縱技術 194
第二節 基因編輯技術 196
一、ZFN和TALEN技術 196
二、基於CRISPR/Cas的基因編輯技術 198
第14章 組學數據育種利用 204
第1節 組學數據與作物育種 204
一、作物育種過程及其遺傳本質 204
二、作物組學數據育種利用途徑 204
第二節 作物育種選擇的基因組學解析 209
一、遺傳重組率圖譜 209
二、作物遺傳傳遞及其變異 211
三、第1優勢 214
第三節 組學相關育種技術 219
一、基因組選擇 219
二、智能設計育種 222
三、其他組學育種技術 228
第15章 植物基因組數據資源 230
第1節 綜合性基因組數據資源 230
一、國際門戶網站及其基因組相關數據庫 230
二、植物基因組數據庫 232
第二節 植物轉錄與修飾相關數據資源 237
一、植物轉錄組相關數據庫 237
二、植物基因組表觀遺傳修飾相關數據庫 239
三、植物多組學數據庫 240
主要參考文獻 242
掃碼解鎖更多資源
本書配套教學PPT
本書第1版各論內容”代表性植物物種基因組”
精彩書摘
第1章 緒論
第1節 基因組及基因組學概念掃碼見本章 彩圖
(一)什麼是基因組
一個生物體的基因組是指一套完整染色體DNA序列。例如,生物個體體細胞中的二倍體由兩套染色體組成,其中一套DNA序列就是一個基因組。也就是說,基因組是指一個細胞或者生物體所攜帶的一套完整的單倍體序列。單倍體序列包括蛋白質編碼和非編碼序列在內的全部DNA序列。”基因組”一詞可以特指整套核DNA(如核基因組),也可以包含細胞器基因組,如線粒體基因組和葉綠體基因組。一個有性生殖物種的基因組,通常是指一套常染色體和兩種性染色體的序列。
1920年,德國漢堡大學漢斯 溫克勒(Hans Winkler)將”gene”和”chromosome”組合,*次提出”genome”一詞。
一套基因組序列可能也綜合了來自不同個體的染色體,即所謂的泛基因組。2005年,Tettelin等提出了泛基因組(pan-genome)概念,泛基因組包括核心基因組(core genome)和非必需基因組(dispensable genome):核心基因組指的是在所有菌株中都存在的基因;非必需基因組指的是僅在部分菌株中存在的基因。2009年,我國科學家在Nature Biotechnology上發表《構建人類泛基因組序列圖譜》,*次提出了”人類泛基因組”的概念,即人類群體基因序列的總和。2013年泛基因組測序開始應用於動植物研究領域。
(二)基因組大小與構成
基因組大小是指一個基因組中的單拷貝DNA總量,一般用皮克(pg,1pg=1×10-12g)或核苷酸堿基總數[往往以百萬個堿基(Mb)為單位]來表示。一般原核生物(如細菌和古細菌)基因組較小,真核生物基因組較大。即使同一類型生物,其基因組大小也會存在巨大差異。植物是基因組跨度*大的一類生物,其核基因組大小可以從63Mb到160 5Gb(詳見第3章
第1節 )。植物除核基因組外,還包含葉綠體基因組和線粒體基因組。葉綠體基因組大小相對穩定,一般在150kb左右(詳見第11章
第1節 );而植物線粒體基因組大小跨度很大,藻類線粒體基因組大小在13~96kb,而被子植物跨度能達到200~700kb,有的甚至能達到11Mb左右。
基因組DNA序列看似簡單,其實其構成很複雜。真核生物核基因組一般包括35%~80%的重複序列和約5%的蛋白質編碼序列,這些編碼序列分佈于整個基因組區域;同時,基因組上有大量非編碼序列,包括結構RNA[如轉運RNA(tRNA)、核糖體RNA(rRNA)、核小RNA(snRNA)]、調節 RNA[如小RNA(miRNA)]和所謂假基因(詳見第3章
第二節 )。從基因組序列中確定這些蛋白質編碼和非編碼基因是生物信息學的一個重要任務。
(三)基因組與轉錄組和蛋白質組的關係
當我們測序獲得一個生物基因組後,得到的僅僅是其一張遺傳藍圖或標準照,對其基因組上的大量基因如何表達和互作及功能還一無所知。這時就涉及其基因組的轉錄和翻譯,即轉錄組和蛋白質組等問題。三個組之間存在密切關係(圖1-1)。
圖1-1基因組與轉錄組和蛋白質組的關係
轉錄組(transcriptome)在廣義上指某一生理條件下,細胞內所有轉錄產物的集合,包括信使RNA(mRNA)、rRNA、tRNA及其他非編碼RNA;狹義上表示所有mRNA的集合,為一個細胞在某一發育階段包含的必需生物信息,這些RNA分子會指導合成基因組表達*終產物——蛋白質。在DNA和RNA水平上可能發生甲基化,直接影響基因轉錄表達,即影響轉錄組構成。蛋白質組(proteome)是指一個生物體基因組、一個細胞或組織所表達的全部蛋白質成分。與基因組不同,轉錄組和蛋白質組作為一個整體,在不同的時空條件下,在一個生物體的不同組織中是不同的,而一個生物體僅有一個特定的基因組。一個生物體的轉錄組和蛋白質組未必與基因組存在一一對應關係,主要是由於基因存在轉錄後的不同剪接方式和翻譯後蛋白質的修飾等。從基因表達的角度來看,蛋白質組的蛋白質數量總是多於基因組的注釋基因數量。
從蛋白質修飾的角度來看,蛋白質組的蛋白質數多於其相應的可讀框(ORF)數目,因為mRNA的剪切和編輯可使一個ORF產生數種蛋白質,蛋白質翻譯後的修飾,如甲基化、乙醯化、糖基化、磷酸化、泛素化等,同樣增加蛋白質的種類。氨基酸序列一致的一級結構,在一定條件下可以形成功能完全不一樣的具有不同空間結構的蛋白質。由此在DNA、RNA和蛋白質水平上,出現了許多基於高通量測序等技術的各種組學數據,除了轉錄組、蛋白質組外,同時包括甲基化組、組蛋白修飾組等。這些組學數據是基因組表達和功能研究的重要基礎數據。
除此之外,基因組還可能產生一些內源性代謝產物(如氨基酸、有機酸、核酸、脂肪酸、胺、糖、維生素、色素、抗生素等),它們有別於蛋白質、RNA和DNA等大分子。這些代謝產物構成了代謝組的一部分。代謝組(metabolomics)是指生物樣品中發現的一整套小分子化學物質。生物樣品可以是細胞、細胞器、器官、組織、組織提取物、體液或整個生物體。在給定代謝組中,小分子化學物質包括生物體天然產生的內源性代謝物,以及生物體不能自然產生的外源性化學物質(如藥物、環境污染物、食品添加劑、毒素等)。換句話說,既有內源代謝組又有外源代謝組。內源代謝組可以進一步細分為”主要”和”次要”代謝組(特別是涉及植物代謝組時,植物次生代謝產物非常豐富)。代謝組小分子通常必須具有<1500Da的分子量,包括糖脂、多糖、短肽(<14個氨基酸)和小寡核苷酸(<5個堿基)等。*終,植物組學數據決定了其性狀,如何準確、全面地收集和確定某一物種全部性狀特徵或表型數據——所謂表型組(phenomics),就成為基因組學研究的*末端或*外圍部分了。
本書內容僅對植物基因組本身及其直接產物(即轉錄組)進行介紹,不再延伸到下一級產物組學內容(如蛋白質組和代謝組等)。
二、基因組學及其技術概述
(一)基因組學定義
基因組學是通過分析基因組DNA序列或其表達中間過程/產物等來解讀基因組信息的一門學科。在技術上,基因組學通過測序和解讀兩個相對*立的環節 來達到目標。定位、注釋基因組序列中功能元件是解讀基因組序列的重要內容,這是一個以生物信息學技術為基礎,並與分子生物學等實驗相結合的過程(中國生物技術發展中心和深圳華大基因研究院,2012)。與分子生物學或遺傳學學科的研究對象為單個或一組基因不同,基因組學研究的對象是相關物種的全部基因組