| *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202309*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:搜索引擎與程序化廣告-原理.設計與實戰 ISBN:9787115617002 出版社:人民郵電 著編譯者:楊敏 頁數:396 所在地:中國大陸 *此為代購商品 書號:1566004 可大量預訂,請先連絡。 內容簡介 本書從源碼的角度講解搜索技術與程序化廣告系統,將技術與業務結合、理論與實踐並重,幫助讀者更好地理解並掌握相關知識。 本書首先從基礎的數據結構出發,帶領讀者深入理解線性結構、樹結構和圖結構的搜索演算法,以及它們的典型應用場景。其次詳細分析全文搜索引擎工具包Lucene,包括其索引結構、分析器、搜索與排名機制,以及Lucene的底層數據結構與演算法。最後,本書從搜索技術過渡到程序化廣告,介紹程序化廣告系統中的各個模塊和工作機制,包含廣告檢索、廣告庫存預測、廣告定位、廣告標籤模板、廣告實時競價、廣告實時數據、廣告事件流聚合、廣告供應鏈透明度等內容。 本書適合從事搜索技術、程序化廣告相關工作或對相關內容感興趣的軟體開發人員閱讀。在閱讀本書之前,讀者需要具備基本的編程能力。作者簡介 楊敏 畢業於浙江大學計算機科學與技術專業,目前就職於一家專門提供互聯網視頻廣告投放、預測和增值等解決方案的公司FreeWheel,擔任廣告供應方平台(Supply-Side Platform,SSP)技術負責人、架構師。 曾在美國道富銀行、Thoughtworks、微軟等公司工作,參与或主持開發過的項目有: ·美國道富銀行的普林斯頓金融系統; ·普華永道全球派遣服務軟體系統; ·微軟SharePoint平台的搜索系統; ·FreeWheel的廣告供應方平台Stickyads tv。 目前專註于Python/Java虛擬機、分散式搜索引擎Elasticsearch、MySQL內核等相關技術領域的研究。目錄 第1章 搜索技術的演算法1 1 背景 1 2 字元串搜索 1 2 1 概述 1 2 2 基礎字元串搜索演算法:暴力搜索演算法 1 2 3 中級字元串搜索演算法:KMP演算法 1 2 4 高級字元串搜索演算法:BM演算法 1 2 5 字元串精確搜索:Grep 1 2 6 字元串模糊搜索 1 3 樹搜索 1 3 1 概述 1 3 2 二叉搜索樹 1 3 3 2-3-4樹 1 3 4 2-3-4樹與紅黑樹的等價關係 1 3 5 紅黑樹操作 1 3 6 紅黑樹典型應用場景 1 4 圖搜索 1 4 1 概述 1 4 2 圖建模中,鄰接矩陣和鄰接表哪種結構更好? 1 4 3 DFS在圖搜索和樹搜索中的應用 1 4 4 DFS無向圖連通分量問題 1 4 5 DFS單源路徑問題 1 4 6 BFS單源(最短)路徑問題 1 4 7 DFS檢測無向圖中的環 1 4 8 二分圖檢測與染色演算法 1 4 9 拓撲排序 1 4 10 動態規劃和遞歸之間的關係 1 5 小結 第2章 Lucene基礎 2 1 背景 2 2 Lucene與傳統關係資料庫 2 2 1 Lucene與傳統關係資料庫的異同 2 2 2 Lucene的全文搜索機制 2 2 3 倒排索引的使用場景 2 3 Lucene與Elasticsearch 2 4 Lucene的倒排索引設計 2 4 1 倒排索引 2 4 2 Posting數據結構 2 4 3 ByteBlockPool動態數組 2 4 4 Posting與ByteBlockPool的關係 2 4 5 ThreadState結構 2 4 6 DocumentsWriter結構 2 5 Lucene的正排索引設計 2 5 1 正排索引與倒排索引 2 5 2 Lucene的正排索引與數學中的向量的關係 2 5 3 正排索引存儲 2 5 4 索引數據的寫流程 2 6 有效負載 2 6 1 有效負載的結構 2 6 2 有效負載的格式 2 6 3 文檔權重與域權重 2 6 4 權重與有效負載 2 6 5 有效負載的應用場景 2 7 複合索引文件 2 7 1 複合索引的文件格式 2 7 2 寫複合索引文件 2 8 小結 第3章 Lucene索引段 3 1 背景 3 2 不同索引結構的比較 3 2 1 MySQL:B+樹 3 2 2 MySQL:哈希索引 3 2 3 Redis:跳錶 3 2 4 Lucene:倒排索引 3 3 索引段的基礎知識 3 3 1 概述 3 3 2 SegmentInfos容器 3 3 3 IndexReader 3 3 4 SegmentReader 3 3 5 倒排索引格式 3 3 6 索引段的讀流程 3 4 索引段的合併 3 4 1 概述 3 4 2 段合併的典型問題 3 4 3 段合併的策略 3 4 4 段合併的簡單流程 3 4 5 合併段內域:mergeFields 3 4 6 合併段內分詞:mergeTerms 3 4 7 合併段內詞向量:mergeVectors 3 5 索引段提交點與快照 3 5 1 概述 3 5 2 提交點 3 5 3 快照 3 5 4 觸發快照的場景 3 6 索引段刪除文檔 3 6 1 概述 3 6 2 del擴展文件 3 6 3 位向量 3 6 4 索引段刪除分詞 3 6 5 索引段查詢分詞 3 7 小結 第4章 Lucene分析器 4 1 背景 4 2 Field、Token與Term概念 4 3 JavaCC與查詢解析器 4 3 1 Yacc與JavaCC 4 3 2 在JavaCC中擴展正則表達式 4 3 3 JavaCC的輸入文件之XX jj 4 3 4 Lucene中Token的正則表達式定義 4 3 5 Lucene語法產生式:分析與生成查詢 4 3 6 getFieldQuery公共函數 4 4 分析器 4 4 1 概述 4 4 2 分析器的組成:分詞器和過濾器 4 4 3 分析器的兩個典型場景 4 4 4 索引的構建流程 4 4 5 QueryParse查詢流程 4 4 6 位置增量 4 5 中文分詞器 4 5 1 概述 4 5 2 中文分詞器的思想 4 5 3 sego中文分詞器 4 5 4 雙數組前綴樹演算法 4 5 5 維特比演算法 4 5 6 迪傑斯特拉演算法 4 6 小結 第5章 Lucene搜索與排名 5 1 背景 5 2 搜索結果排名 5 2 1 TF-IDF模型 5 2 2 餘弦相似性 5 3 過濾器 5 3 1 概述 5 3 2 過濾 5 3 3 CachingWrapperFilter 5 3 4 創建自定義過濾器 5 3 5 過濾與查詢的區別 5 4 全文搜索 5 4 1 概述 5 4 2 Query、Weight和Scorer對象樹 5 4 3 搜索流程(關閉過濾器) 5 5 短語搜索:相關性搜索 5 5 1 概述 5 5 2 一個查詢短語舉例 5 5 3 TermPositions與TermDocs 5 5 4 PhraseQuery類體系 5 5 5 PhraseScorer工作流 5 5 6 MultiPhraseQuery 5 6 模糊搜索:利用模糊性改善搜索性能 5 6 1 概述 5 6 2 編輯距離演算法 5 6 3 FuzzyQuery工作流 5 7 小結 第6章 Lucene的底層數據結構與演算法 6 1 背景 6 2 編碼與壓縮演算法 6 2 1 概述 6 2 2 前綴編碼 6 2 3 增量編碼 6 2 4 變長位元組編碼 6 3 跳錶結構:分層有序鏈表 6 3 1 概述 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。  |