| *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202405*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:並行程序設計 ISBN:9787302660965 出版社:清華大學 著編譯者:劉軼 楊海龍 頁數:317 所在地:中國大陸 *此為代購商品 書號:1642181 可大量預訂,請先連絡。 內容簡介 本書是針對「并行程序設計」「并行計算」等課程編寫的教材,內容包括并行計算基礎知識、共享內存系統的OpenMP和Pthreads多線程編程、消息傳遞系統的MPI編程、Slurm作業管理系統、GPU等異構系統的CUDA/OpenCL/OpenACC/Athread編程、常用的并行設計與性能優化方法、典型并行應用演算法等,另外,還特別增加了針對我國自主研發的申威處理器編程的相關內容。本書涵蓋并行程序設計最常用的編程語言/介面、設計與性能優化方法、基礎應用演算法等內容,一方面反映了OpenMP、MPI等成熟編程語言介面的新特性,以及GPU異構編程等新型編程介面;另一方面在典型并行應用演算法部分嘗試用計算機專業人員易於理解的方式介紹典型演算法,特別是以線性方程組迭代求解方法中的共軛梯度法為例。本書每章都設置了以編程為主的習題,鼓勵讀者通過編寫程序掌握相關方法。 本書適合作為計算機和信息類專業高年級本科生和研究生的教材,也可供高性能計算和并行計算領域的科研人員參考。作者簡介 楊海龍,博士,北京航空航天大學計算機學院助理教授,中國計算機學會體繫結構專委會委員。在ISCA、ASPLOS、TOCS、TPDS、ICS等國際頂級/知名會議和期刊上發表學術論文20餘篇。主要研究方向為深度學習系統優化、高性能計算性能分析工具、大數據系統性能分析與優化、雲計算資源管理和任務調度、高吞吐計算、GPU并行編程與優化。近年來主持,參与多項國家重大/重點研究項目,相關研究成果成功應用到飛機設計多學科優化、生物醫藥、高性能模式程序開發等領域中。目錄 第1章 并行程序設計概述1 1 并行性概述 1 2 如何衡量計算速度 1 3 并行計算系統基本知識 1 3 1 弗林分類 1 3 2 共享內存系統與消息傳遞系統 1 3 3 幾種常見的并行計算系統 1 3 4 互連網路 1 3 5 多級存儲體繫結構 1 4 并行編程語言/介面分類 1 5 浮點數格式 1 6 例子程序 1 6 1 矩陣相乘 1 6 2 規約和掃描 1 7 小結 習題 第2章 共享內存系統并行編程 2 1 共享內存系統中的并行模型 2 1 1 多線程并行概述 2 1 2 同步與互斥的概念 2 2 OpenMP編程 2 2 1 概述 2 2 2 OpenMP的基本命令 2 2 3 共享工作構造及其組合 2 2 4 線程問同步與互斥 2 2 5 常用子句 2 2 6 OpenMP示常式序:級數法計算圓周率 2 2 7 task工作構造 2 3 Pthreads編程 2 3 1 Pthreads簡介 2 3 2 線程的創建和終止 2 3 3 線程互斥 2 3 4 Pthreads示常式序:級數法計算圓周率 2 3 5 線程同步 2 3 6 Pthreads示常式序:生產者-消費者 2 3 7 線程死鎖與鎖粒度 2 4 面向多核系統的新型編程語言/介面 2 4 1 Cilk與Cilk++ 2 4 2 TBB 2 5 小結 習題 第3章 消息傳遞系統并行編程 3 1 MPI簡介 3 1 1 MPI是什麼? 3 1 2 MPI的并行模式 3 1 3 一個簡單的MPI程序 3 1 4 MPI基本環境 3 1 5 通信子、進程組、進程號 3 1 6 MPI數據類型 3 1 7 MPI通信簡介 3 2 點對點通信 3 2 1 標準通信模式 3 2 2 緩存通信模式 3 2 3 同步通信模式 3 2 4 就緒通信模式 3 2 5 四種通信模式小結 3 2 6 組合發送接收 3 2 7 非阻塞通信 3 3 集合通信 3 3 1 集合通信概述 3 3 2 數據廣播MPI_Bcast 3 3 3 數據分發MPI_Scatter 3 3 4 數據收集MPI_Gather 3 3 5 組收集MPI_Allgather 3 3 6 全互換MPI_Alltoall 3 3 7 規約MPI_Reduce 3 3 8 組規約MPI_Allreduce 3 3 9 掃描MPI_Scan 3 3 10 柵欄MPI_Barrier 3 4 一個MPI示常式序 3 4 1 數值積分的計算 3 4 2 基於數值積分的圓周率計算程序 3 4 3 MPI牆鍾時間 3 5 進程組和通信子 3 5 1 組管理 3 5 2 通信子管理 3 5 3 組間通信子 3 6 MPI與多線程 3 6 1 如何在MPI程序中使用多線程 3 6 2 MPI+OpenMP示常式序 3 6 3 分析和討論 3 7 進程拓撲 3 7 1 進程拓撲簡介 3 7 2 創建進程拓撲 3 7 3 進程拓撲相關的通信函數 3 8 PGAS編程及語言 3 9 作業管理系統及使用 3 9 1 作業管理系統簡介 3 9 2 Slurm簡介 3 9 3 在Slurm中以作業方式執行程序 3 9 4 Slurm的作業腳本 3 9 5 在Slurm中以其他方式執行程序 3 9 6 Slmm常用命令 3 10 小結 習題 第4章 異構系統并行編程 4 1 異構系統編程概述 4 2 面向NVIDIA GPU的CUDA編程 4 2 1 CUDA概述 4 2 2 Hello World程序:CUDA程序的基本形態 4 2 3 兩個整數相加程序:CPU-GPU數據交換 4 2 4 向量求和程序:CUDA多線程 4 2 5 CUDA線程組織 4 2 6 CUDA內存層次與變數修飾符 4 2 7 函數修飾符 4 2 8 CUDA流 4 2 9 性能優化 4 2 10 CUDA統一內存空間 4 2 11 使用多GPU 4 3 OpenCL編程 4 3 1 OpenCL概述 4 3 2 OpenCL程序的執行流程及相關API 4 3 3 OpenCL示常式序一:向量求和 4 3 4 OpenCL的執行模型與線程組織 4 3 5 OpenCL的內存層次結構 4 3 6 OpenCL示常式序二:矩陣相乘 4 4 面向申威處理器的Athread編程 4 4 1 申威處理器及其編程簡介 4 4 2 Hello World程序:Athread程序的基本形態 4 4 3 Athread變數的局部存儲空間屬性 4 4 4 Athread主一從核編程介面 4 4 5 Athread寄存器通信 4 4 6 Athread版的Cannon并行矩陣相乘 4 5 OpenACC編程 4 5 1 OpenACC概述 4 5 2 OpenACC語法 4 5 3 OpenACC循環并行性 4 5 4 基於申威處理器的OpenACC編程 4 6 小結 習題 第5章 并行程序性能優化 5 1 Amdahl定律 5 2 影響性能的主要因素 5 2 1 并行開銷 5 2 2 負載均衡 5 2 3 并行粒度 5 2 4 并行劃分 5 2 5 依賴關係 5 2 6 局部性 5 3 并行程序的可擴展性及性能優化方法 5 3 1 什麼是并行程序的可擴展性? 5 3 2 確保并行程序可擴展性的重要原則:獨立計算塊 5 3 3 數據劃分對性能和可擴展性的影響 5 3 4 其他常用性能優化方法 5 4 PCAM并行設計方法 5 4 1 劃分 5 4 2 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |