信息檢索與搜索引擎-微課版 閆琰 9787302660989 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
NT$312
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202404*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:信息檢索與搜索引擎-微課版
ISBN:9787302660989
出版社:清華大學
著編譯者:閆琰
頁數:165
所在地:中國大陸 *此為代購商品
書號:1635463
可大量預訂,請先連絡。

內容簡介

為了讓讀者全面了解信息檢索和搜索引擎的基本概念、原理和實現方法,以及相關的研究和應用領域,本書詳細闡述了信息檢索中的重要問題。 全書共分為3篇,涵蓋信息檢索和搜索引擎的各個方面:第1篇(第1∼3章)為基礎篇,介紹信息檢索和搜索引擎的基本概念、原理以及信息採集、文本轉換方法;第2篇(第4∼6章)為技術篇,涵蓋索引創建、用戶交互、檢索模型與搜索排序等關鍵技術;第3篇(第7章和第8章)為應用篇,討論搜索引擎評價和鏈接分析,展示搜索引擎在不同領域的應用和發展趨勢。全書提供了大量應用實例,每章后均附有習題。 通過對這些方面的講解,讀者可以了解信息檢索和搜索引擎的相關技術和方法,掌握它們的實現和應用,為信息處理提供更好的解決方案。

作者簡介

閆琰,中國礦業大學(北京)副教授,碩士生導師。出版專著《基於深度學習的文本表示與分類方法研究》。目前主要從事信息檢索、自然語言處理、機器學習、人工智慧等領域的教學與研究工作。

目錄

第1章 信息檢索和搜索引擎
1 1 什麼是信息檢索
1 1 1 Web搜索
1 1 2 其他搜索應用
1 1 3 其他信息檢索應用
1 2 搜索引警架構
1 2 1 搜索引擎
1 2 2 基本的構件
1 3 搜索引擎構件及其功能
1 3 1 文本採集
1 3 2 文本轉換
1 3 3 索引創建
1 3 4 用戶交互
1 3 5 排序
1 3 6 評價
1 4 開源的搜索引擎系統
1 4 1 Lucene
1 4 2 Solr
1 4 3 ElasticSearch
1 5 搜索引擎面對的挑戰
小結
習題
第2章 信息採集
2 1 網頁
2 1 ,1網頁的特點
2 1 2 網頁規模的估計
2 1 3 網頁的年齡
2 2 網頁爬蟲
2 2 1 網頁爬蟲的定義
2 2 2 網頁爬蟲的執行流程
2 2 3 設計網頁爬蟲的原則
2 2 4 網頁爬蟲的評價指標
2 2 5 爬取策略
2 2 6 深網爬取
2 3 網站地圖
2 4 非網頁類信息採集
2 5 存儲文檔
2 5 1 形成摘要
2 5 2 存儲摘要
2 5 3 文檔更新
2 5 4 網頁去重和去噪
小結
習題
第3章 文本轉換
3 1 文本的統計特徵
3 1 1 詞頻分佈
3 1 2 關聯網頁規模估計
3 2 停用詞去除
3 3 詞幹提取
3 3 1 基於規則的詞幹提取
3 3 2 基於詞典的詞幹提取
3 3 3 對比詞幹提取和詞形還原
3 4 詞素切分
3 4 1 基於字元串匹配的詞素切分方法
3 4 2 基於統計的詞素切分方法
3 4 3 英文詞素切分(N元串)
3 5 文本轉換的困難
3 6 文本的向量化表示
3 6 1 離散表示
3 6 2 分散式表示
小結
習題
第4章 索引創建
4 1 索引相關定義
4 1 1 單詞-文檔矩陣
4 1 2 單詞詞典
4 1 3 倒排索引相關概念
4 1 4 倒排索引簡單實例
4 2 索引的建立
4 2 1 兩遍文檔遍曆法
4 2 2 排序法
4 2 3 歸併法
4 3 索引更新
4 3 1 動態索引
4 3 2 倒排索引的插入
4 3 3 倒排索引的刪除
4 4 查詢處理方法
4 4 1 Document-at-a-time
4 4 2 Term-at-a-time
4 4 3 查詢優化
小結
習題
第5章 用戶交互
5 1 信息需求與查詢
5 2 查詢轉換與提煉
5 2 1 停用詞去除和詞幹提取
5 2 2 拼寫檢查
5 3 查詢擴展
5 3 1 基於全局分析的查詢擴展
5 3 2 基於相關反饋和偽相關反饋的查詢擴展
5 3 3 基於查詢日誌的查詢擴展
5 4 上下文和個性化
5 5 查詢推薦
5 5 1 基於文檔的方法
5 5 2 基於查詢日誌的方法
5 6 搜索結果顯示
小結
習題
第6章 檢索模型與搜索排序
6 1 檢索模型概述
6 1 1 布爾模型
6 1 2 向量空間模型
6 1 3 BOW模型
6 1 4 Latent Dirichlet Allocation
6 1 5 隱性語義分析
6 2 概率模型
6 2 1 概率檢索模型
6 2 2 二元獨立模型
6 2 3 BM25模型
6 3 語言模型
6 3 1 One-Hot和Word2Vec
6 3 2 -CBOW模型
6 3 3 Skip-gram模型
6 4 排序模型
6 4 1 K-L散度
6 4 2 Learning to Rank演算法
6 5 基於機器學習的排序方法
小結
習題
第7章 搜索引擎評價
7 1 搜索引擎評價的意義
7 2 搜索引擎評價體系
7 3 效果評價
7 3 1 召回率、精確率、ROC曲線
7 3 2 平均精確率
7 3 3 關注排序靠前的文檔
7 3 4 使用用戶偏好
7 4 效率評價
7 5 訓練、測試和統計
7 5 1 比較評價
7 5 2 顯著性檢驗
7 5 3 最小化判定工作
7 5 4 設置參數值
小結
習題
第8章 鏈接分析
8 1 PageRank演算法
8 1 1 什麼是PageRank
8 1 2 PageRank的工作原理
8 1 3 PageRank計算
8 1 4 PageRank應用與分析
8 2 HITS演算法
8 2 1 什麼是HITS
8 2 2 HITS工作原理
8 2 3 HITS演算法存在的問題
8 2 4 HITS與PageRank比較
8 2 5 其他改進演算法
8 3 網頁作弊技術
8 3 1 基於內容的作弊技術
8 3 2 基於鏈接關係的作弊技術
8 3 3 掩蓋技術和重定向技術
8 4 網頁反作弊技術
8 4 1 特定類別的作弊頁面識別技術
8 4 2 非特定類別的作弊頁面識別技術
小結
習題
參考文獻

詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理