*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202407*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:大數據工程師面試筆試寶典 ISBN:9787111753872 出版社:機械工業 著編譯者:楊俊 姜偉 許朋舉 頁數:239 所在地:中國大陸 *此為代購商品 書號:1670867 可大量預訂,請先連絡。 內容簡介 本書全面講解了大數據的核心技術及如何解答大數據工程師面試筆試中的常見問題,還引入了相關知識點輔以說明,讓讀者對所學知識進行查漏補缺,幫助讀者順利通過大數據工程師面試筆試。 本書的題目均來自一線互聯網公司面試筆試真題,涵蓋大數據基礎、大數據生態圈技術組件以及大數據不同崗位的面試筆試題。第1∼2章主要介紹了職業道路如何選擇、面試筆試前如何準備、面試筆試過程中如何應對,以及面試經常遇到的「坑」。第3章介紹了大數據基礎面試筆試題,讓讀者學會利用大數據思維解決常見應用場景;第4∼10章重點介紹了大數據生態圈核心技術的面試筆試題,讓讀者加強對大數據技術組件的理解;第11∼13章介紹了大數據倉庫、大數據項目、大數據運維方向的常見面試筆試題;第14章探討了大數據與人工智慧的交叉點,讓讀者可以輕鬆應對大數據工程師的面試筆試。 本書內容的深度和廣度貼近實際,將幫助大數據領域的求職者為面試筆試做好充分的準備,提高面試成功率,同時,本書也可作為從業者的實用工具書,以加深對大數據技術和實踐的理解。無論是初學者還是有經驗的專業人士,都將從本書提供的詳實信息和實用建議中受益。作者簡介 楊俊,大數據架構師。大數據技術達人, Hadoop源碼級技術專家,擅長Hadoop、Spark、Flink等主流大數據生態技術。具有近10年大數據開發經驗,參与過10餘個重量級大數據項目。曾任廣電數據諮詢公司大數據高級架構師,負責大數據平台架構設計與實施,並構建企業級數據倉庫。暢銷書《Hadoop大數據技術基礎與應用》作者。51CTO知名培訓講師,擁有20餘萬粉絲,具有豐富的大數據技術培訓經驗,為數十家企業、院校開展過大數據技術課程培訓。目錄 前言第1章 面試筆試心得交流 1 1 擺正求職心態 1 2 求職前準備 1 3 做好自我介紹 1 4 職業規劃是什麼 1 5 為什麼離開上一家公司 1 6 被面試官否定怎麼辦 1 7 加分項一定要呈現出來 1 8 面試禁忌 1 9 面試會有哪些「坑」 1 10 如何應對自己不會回答的問題 1 11 如何應對某一次面試失敗 1 12 面試成功是否就高枕無憂 第2章 大數據工程師面試筆試攻略 2 1 大數據職業的崗位劃分 2 2 典型大數據工程師的職業發展路徑 2 3 公司大數據部門劃分與人員編製 2 4 大數據工程師的工作職責 2 5 大數據工程師簡歷如何編寫 2 6 缺少大數據項目經驗如何應對 2 7 大數據面試筆試需要掌握哪些技能 2 8 如何把握大數據工程師的面試筆試重點 2 9 引導面試官提問自己擅長的技術 第3章 大數據基礎應用 3 1 大數據基礎知識 3 1 1 大數據生態體系 3 1 2 大數據基石—雲計算 3 1 3 大數據核心—海量數據 3 1 4 大數據靈魂—大數據技術 3 1 5 大數據價值—商業應用 3 2 大數據演算法 3 2 1 如何從海量數據中找出最高頻詞 3 2 2 如何找出訪問百度次數最多的IP地址 3 2 3 如何從2 5億個整數中找出不重複的整數 3 2 4 判斷一個數在40億數據中是否存在 3 2 5 如何找出CSDN網站最熱門的搜索關鍵詞 3 2 6 如何從大量數據中統計不同手機號的個數 3 2 7 如何從大量數據中找出重複次數最多的一條數據 3 2 8 如何對大量數據按照query的頻度排序 3 2 9 如何從大量的URL中找出相同的URL 3 2 10 如何從5億個數中找出中位數 第4章 ZooKeeper分散式協調服務 4 1 簡述ZooKeeper包含哪些重要特性 4 2 簡述ZooKeeper包含哪些應用場景 4 3 簡述ZooKeeper包含哪幾種Znode節點類型 4 4 請問ZooKeeper對Znode的監聽是永久的嗎 4 5 請問ZooKeeper集群包含多少節點合適 4 6 簡述ZooKeeper集群節點包含哪些角色 4 7 簡述ZooKeeper集群節點有哪幾種工作狀態 4 8 請問ZooKeeper節點宕機后內部如何處理 4 9 請問ZooKeeper集群是否支持動態添加機器 4 10 簡述ZooKeeper集群的數據讀寫流程 4 11 簡述ZooKeeper的監聽器原理 4 12 談談你對CAP原則的理解 4 13 談談ZAB協議在ZooKeeper中的作用 4 14 談談你對ZooKeeper選舉機制的理解 4 15 闡述ZooKeeper如何保證事務的順序一致性 4 16 闡述如何遷移ZooKeeper集群 第5章 Hadoop大數據平台 5 1 Hadoop分散式文件系統(HDFS) 5 1 1 闡述HDFS中的數據塊大小設置 5 1 2 簡述HDFS的副本存放策略 5 1 3 闡述如何處理HDFS大量小文件問題 5 1 4 簡述NameNode元數據存儲在什麼位置 5 1 5 闡述如何解決edits文件過大的問題 5 1 6 簡述HDFS讀數據流程 5 1 7 簡述HDFS寫數據流程 5 1 8 簡述NameNode HA的運行機制 5 1 9 簡述HDFS聯邦機制 5 1 10 闡述如何處理NameNode宕機問題 5 1 11 闡述如何處理DataNode宕機問題 5 1 12 簡述HDFS支持哪些存儲格式與壓縮演算法 5 2 Hadoop資源管理系統(YARN) 5 2 1 簡述YARN應用的運行機制 5 2 2 闡述YARN與MapReduce1的異同 5 2 3 簡述YARN 高可用原理 5 2 4 簡述YARN的容錯機制 5 2 5 簡述YARN調度器的工作原理 5 2 6 闡述YARN的任務提交流程 5 3 Hadoop分散式計算框架(MapReduce) 5 3 1 簡述MapReduce作業運行機制 5 3 2 簡述MapReduce Shuffle過程 5 3 3 簡述MapReduce作業失敗與容錯機制 5 3 4 闡述如何解決MapReduce數據傾斜問題 5 3 5 簡述MapReduce二次排序原理 5 3 6 簡述MapReduce Join實現原理 第6章 Hive數據倉庫工具 6 1 簡述Hive與傳統資料庫的異同 6 2 簡述Hive與HBase的異同 6 3 簡述Hive包含哪些建表方式 6 4 簡述Hive內部表與外部表的區別 6 5 簡述Hive分區表與分桶表的區別 6 6 簡述Hive包含哪些表連接方式 6 7 簡述collect_list()與collect_set()函數的區別 6 8 簡述ORDER BY、DISTRIBUTE BY、SORT BY和 CLUSTER BY的區別與聯繫 6 9 談談如何預防Hive查詢全表掃描 6 10 簡述Hive包含哪些自定義函數 6 11 闡述如何解決Hive數據傾斜問題 6 12 闡述Hive有哪些性能調優手段 第7章 HBase分散式資料庫 7 1 簡述HBase的應用場景 7 2 簡述HBase讀數據流程 7 3 簡述HBase寫數據流程 7 4 闡述HBase Region如何定位 7 5 簡述HBase Region的合併與分裂過程 7 6 闡述HBase如何設計RowKey 7 7 闡述HBase如何實現預分區 7 8 談談你對HBase二級索引的理解 7 9 闡述HBase如何降低磁碟IO 7 10 闡述HBase如何處理冷熱數據 7 11 簡述HBase有 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |