| *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202410*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:經典並行與量子並行-提升並挖掘計算系統的潛在性能 ISBN:9787111750826 出版社:機械工業 著編譯者:劉宇航 叢書名:計算機科學前沿叢書 頁數:578 所在地:中國大陸 *此為代購商品 書號:1686364 可大量預訂,請先連絡。 內容簡介 本書深入淺出介紹后摩爾時代的并行計算核心技術,理論與實踐並重,同時兼顧數學模型、結構模型、編程模型。本書具有以下特色:從概念上明確算勢與算力的聯繫與區別,強調在後摩爾時代背景下從潛在能力(算勢)到實際能力(算力)的充分轉化的重要性;注重量化分析和理論推導,單列一章對計算性能模型和存儲性能進行了介紹;注重并行應用程序的設計,單列一章介紹並對比分析了共享存儲編程與非共享存儲編程的基本原理;注重融會貫通,培養整體觀念,分別考察了共享存儲結構和分散式存儲結構,揭示潛在的可利用的并行硬體資源以及對應的編程方法;編製了大量的原創的有助於提高讀者理解深度和應用知識能力的例題;在國內外同類教材或專著中,率先以算勢和算力的統一的視角,系統對比了經典并行計算與量子并行計算,促進兩個領域的溝通融合。 本書可供計算機系統和晶元設計人員、期望利用并行計算的思想和技術解決具體領域問題的人員使用,也可作為教材供理工科專業的高年級本科生和研究生及相關專業技術人員使用。作者簡介 劉宇航,中國科學院計算技術研究所副研究員,碩士生導師,研究方向為計算機體繫結構,包括高性能計算、數據密集型計算、存儲系統、智能併發系統等。在國內外有影響的期刊和學術會議上發表多篇高水平論文,多項關鍵技術實際落地應用到工業界一線晶元或系統,致力解決卡脖子技術問題。獲中國科學院計算技術研究所「優秀研究人員」「卓越之星」、計算機體繫結構國家重點實驗室「優秀研究人員」等榮譽稱號。擔任中國科學院大學崗位副教授(講授研究生必修課「并行處理」)、中國科學院大學「一生一芯」計劃指導教師、《中國計算機學會通訊》專欄作家、中國計算機學會職業倫理和學術道德委員會常務委員、中國計算機學會高級會員、《中國計算機學會通訊》編委。目錄 推薦序一推薦序二 前言 第1章 計算概念的譜系 1 1 引言 1 2 計算概念譜系化的意義 1 3 計算概念的譜系 1 3 1 算勢 1 3 2 算力 1 3 3 算術 1 3 4 演算法 1 3 5 算禮 1 4 計算概念譜系組分的相互關係 1 5 從場的角度認識算勢與算力的異同 1 6 證明與計算之間的關係 1 7 本章小結 1 8 思考題 參考文獻 第2章 并行處理的意義及挑戰 2 1 引言 2 2 并行計算機與應用和工藝的關係 2 3 并行處理的普遍性 2 4 多核微處理器技術 2 5 并行處理需要應對的挑戰 2 6 并行處理的學科任務 2 7 本章小結 2 8 思考題 參考文獻 第3章 并行處理的一般原理 3 1 引言 3 2 馮·諾依曼結構 3 3 通過實例說明指令級并行與數據依賴 3 4 通過實例說明線程級并行 3 5 延遲隱藏和延遲減少 3 6 并行處理技術的圖形化表示 3 7 費林分類法 3 8 指令級并行 3 8 1 流水線技術 3 8 2 指令的動態調度 3 8 3 多發射技術 3 9 并行計算機系統的分類 3 9 1 向量計算機 3 9 2 多處理機 3 9 3 多主機 3 9 4 大規模并行處理計算機 3 10 并行結構的類型 3 10 1 單處理器的并行結構 3 10 2 多處理器的并行結構 3 10 3 處理機結構創新的歷史 3 10 4 多核共享內存模型 3 10 5 多核消息傳遞模型 3 11 本章小結 3 12 思考題 參考文獻 第4章 計算性能模型和存儲性能模型 4 1 引言 4 2 并行執行時間效率模型 4 3 可擴展定律 4 3 1 阿姆達爾定律 4 3 2 古斯塔夫森-巴西斯定律 4 3 3 存儲受限的擴展定律(孫-倪定律) 4 4 并行計算模型 4 4 1 PRAM模型 4 4 2 BSP模型 4 4 3 LogP模型 4 5 程序性能指標 4 5 1 單道程序工作負載的性能指標 4 5 2 多道程序工作負載的性能指標 4 6 存儲系統的性能指標 4 6 1 平均存儲訪問時間 4 6 2 存儲延遲與存儲帶寬 4 6 3 單位時鐘周期完成的存儲訪問數量 4 6 4 併發平均存儲訪問時間 4 6 5 存儲級并行性 4 6 6 併發感知的局部性 4 7 基準測試 4 7 1 基準測試的定義和分類 4 7 2 基準測試運行的規範 4 7 3 基準測試程序組的要求 4 7 4 基準測試的開發者 4 7 5 性能測試結果的總結 4 8 性能評估方式 4 8 1 Roofline模型 4 8 2 模擬器 4 8 3 需要避免的4個陷阱 4 9 本章小結 4 10 思考題 參考文獻 第5章 共享存儲結構與編程 5 1 引言 5 2 共享存儲體繫結構的類型 5 3 并行編程模型 5 3 1 抽象與實現的區別及其實例 5 3 2 通信與協作 5 3 3 通信層面三種并行編程模型的特點 5 3 4 混合編程模型 5 4 并行處理的流程 5 4 1 思路和實例 5 4 2 問題分解 5 4 3 任務分配 5 4 4 協調 5 4 5 進程映射 5 5 并行編程優化 5 5 1 靜態分配與動態分配 5 5 2 延遲與帶寬 5 5 3 內在通信與人為通信 5 6 減少通信的技術 5 6 1 利用時間局部性 5 6 2 利用空間局部性 5 7 共享內存體繫結構 5 8 共享內存體繫結構編程——OpenMP 5 9 實驗——OpenMP 5 9 1 實驗——OpenMP求sinx 5 9 2 實驗——OpenMP求π值 5 9 3 實驗——OpenMP求斐波那契數列第n項 5 9 4 實驗——Gauss-Seidel迭代演算法的并行實現及其優化 5 10 本章小結 5 11 思考題 參考文獻 第6章 分散式存儲結構與編程 6 1 引言 6 2 向量處理機體繫結構 6 2 1 結構特點 6 2 2 性能分析 6 2 3 向量指令并行 6 2 4 向量鏈 6 2 5 向量分解strip-mining技術 6 2 6 向量條件執行 6 2 7 壓縮/展開操作 6 2 8 向量歸約 6 2 9 存儲訪問 6 2 10 分散和聚集 6 3 SIMD編程 6 3 1 SIMD簡介 6 3 2 實現向量化的幾種方法 6 3 3 向量化編譯指令 6 3 4 向量化過程中的主要挑戰 6 3 5 編譯器向量化方式 6 3 6 循環變換 6 3 7 數據地址對齊 6 3 8 別名 6 3 9 條件語句 6 3 10 原生SIMD支持 6 4 CUDA編程 6 4 1 異構計算的定義 6 4 2 CUDA 6 4 3 GPU的併發控制 6 4 4 GPU的內存管理 6 4 5 SIMT 6 4 6 CUDA編程 6 4 7 CUDA與GPU硬體之間的映射 6 4 8 深流水線設計 6 4 9 GPU內存 6 4 10 GPU併發策略 6 4 11 庫函數介紹 6 5 MPI編程 6 5 1 MPI在編程模型內的分類定位 6 5 2 信息交互模型與通信方式 6 5 3 MPI基本函數 6 5 4 MPI程序執行(以C on linux為例) 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。  |