| *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202311*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:自然語言處理原理與實戰 ISBN:9787302632726 出版社:清華大學 著編譯者:陳敬雷 頁數:420 所在地:中國大陸 *此為代購商品 書號:1599426 可大量預訂,請先連絡。 內容簡介 本書從自然語言處理基礎開始,逐步深入各種自然語言處理的熱點前沿技術,使用了Java和Python兩門語言精心編排了大量代碼實例,契合公司實際工作場景技能,側重實戰。 全書共19章,詳細講解中文分詞、詞性標註、命名實體識別、依存句法分析、語義角色標註、文本相似度演算法、語義相似度計算等內容,同時提供配套完整實戰項目,例如對話機器人實戰、搜索引擎項目實戰、推薦演算法系統實戰。 本書理論聯繫實踐,深入淺出,知識點全面。通過閱讀本書,讀者不僅可以理解自然語言處理知識,還能通過實戰項目案例更好地將理論融入實際工作中。 本書適合自然語言處理的初學者閱讀,有一定經驗的演算法工程師也可從書中獲取很多有價值的知識,並通過實戰項目更好地理解自然語言處理的核心內容。作者簡介 陳敬雷,充電了么創始人,中國首席數據官聯盟專家委員。擁有十幾年互聯網從業經驗,在技術領域,尤其在大數據和人工智慧方向有豐富的演算法工程落地實戰經驗,其中在獵聘網任職期間主導的推薦演算法系統項目獲得公司優秀項目獎,推薦效果得到5倍的提升。目前專註于大數據和人工智慧驅動的上班族在線教育行業,研發了充電了么App,用深度學習演算法、NLP、推薦引擎等技術來高效提升在線學習效率。目錄 第1章 自然語言處理技術概述1 1 自然語言處理介紹 1 1 1 自然語言處理的定義及其在實際工作中的定位 1 1 2 自然語言處理的經典應用場景 1 2 自然語言處理的技能要求和職業發展路徑 1 2 1 大數據部門組織架構和自然語言處理職位所處位置 1 2 2 自然語言處理的職位介紹和技能要求 1 2 3 自然語言處理的職業生涯規劃和發展路徑 1 2 4 自然語言處理的市場平均薪資水平 第2章 中文分詞 2 1 中文分詞原理 2 2 規則分詞 2 2 1 正向最大匹配法 2 2 2 逆向最大匹配法 2 2 3 雙向最大匹配法 2 3 機器學習統計分詞 2 3 1 隱馬爾可夫模型分詞 2 3 2 感知器分詞 2 3 3 CRF分詞 2 4 分詞工具實戰 2 4 1 CRF++工具包實戰 2 4 2 Python的Jieba分詞 2 4 3 Java的HanLP分詞 2 4 4 Java的IK分詞 2 4 5 Java的mmseg4j分詞 第3章 詞性標註 3 1 詞性標註原理 3 1 1 詞性介紹 3 1 2 HMM詞性標註 3 1 3 感知器詞性標註 3 1 4 CRF詞性標註 3 2 詞性標註工具實戰 3 2 1 Python的Jieba詞性標註 3 2 2 Java的HanLP詞性標註 第4章 命名實體識別 4 1 命名實體識別原理 4 2 基於HMM角色標註的命名實體識別 4 2 1 中國人名識別 4 2 2 地名識別 4 2 3 機構公司名識別 4 3 基於線性模型的命名實體識別 4 3 1 感知器命名實體識別 4 3 2 CRF命名實體識別 第5章 依存句法分析 5 1 依存句法分析原理 5 2 HanLP基於神經網路依存句法分析器 第6章 語義角色標註 6 1 語義角色標註原理 6 2 語義角色標註的設計框架 6 2 1 生成語義生成樹 6 2 2 剪枝 6 2 3 角色識別 6 2 4 角色分類 第7章 文本相似度演算法 7 1 字元串編輯距離 7 1 1 演算法原理 7 1 2 Java代碼實現 7 1 3 Python代碼實現 7 2 餘弦相似度 7 2 1 演算法原理 7 2 2 Java代碼實現 7 2 3 Python代碼實現 第8章 語義相似度計算 8 1 《同義詞詞林》 8 1 1 演算法原理 8 1 2 代碼實戰 8 2 基於深度學習的語義相似度 8 2 1 DSSM 8 2 2 CNN-DSSM 8 2 3 LSTM-DSSM 第9章 詞頻-逆文檔頻率 9 1 TF-IDF演算法原理 9 2 Java代碼實現TF-IDF 9 3 TF-IDF的Python代碼實現 第10章 條件隨機場 10 1 演算法原理 10 2 開源工具實戰 第11章 新詞發現與短語提取 11 1 新詞發現 11 2 短語提取 第12章 搜索引擎SolrCloud和Elasticsearch 12 1 全文搜索引擎介紹及原理 12 2 Lucene搜索引擎 12 3 SolrCloud 12 3 1 SolrCloud介紹及原理 12 3 2 SolrCloud實戰 12 4 Elasticsearch 12 4 1 Elasticsearch介紹及原理 12 4 2 Elasticsearch實戰 第13章 Word2Vec詞向量模型 13 1 Word2Vec詞向量模型介紹及原理 13 2 Word2Vec詞向量模型實戰 13 2 1 Spark分散式實現Word2Vec詞向量模型 13 2 2 谷歌開源Word2Vec工具 第14章 文本分類 14 1 文本分類介紹及相關演算法 14 2 樸素貝葉斯演算法 14 2 1 演算法原理 14 2 2 源碼實戰 14 3 支持向量機 14 3 1 演算法原理 14 3 2 源碼實戰 14 4 Python開源快速文本分類器FastText 14 4 1 FastText框架核心原理 14 4 2 FastText和Word2Vec的區別 14 4 3 FastText實戰 14 5 BERT文本分類 14 5 1 BERT模型介紹及原理 14 5 2 BERT中文文本分類實戰 第15章 文本聚類 15 1 文本聚類介紹及相關演算法 15 2 K-means文本聚類 15 2 1 演算法原理 15 2 2 源碼實戰 15 3 LDA主題詞——潛在狄利克雷分佈模型 15 3 1 演算法原理 15 3 2 源碼實戰 第16章 關鍵詞提取和文本摘要 16 1 關鍵詞提取 16 1 1 關鍵詞提取介紹及相關演算法 16 1 2 基於Python的關鍵詞提取實戰 16 1 3 基於Java的關鍵詞提取實戰 16 2 文本摘要 16 2 1 文本摘要介紹及相關演算法 16 2 2 基於Python的文本摘要實戰 16 2 3 基於Java的文本摘要實戰 第17章 自然語言模型 17 1 自然語言模型原理與介紹 17 2 N-Gram統計語言模型 17 3 LSTM神經網路語言模型 第18章 分散式深度學習實戰 18 1 TensorFlow深度學習框架 18 1 1 TensorFlow原理和介紹 18 1 2 TensorFlow安裝部署 18 2 MXNet深度學習框架 18 2 1 MXNet原理和介紹 18 2 2 MXNet安裝部署 18 3 神經網路演算法 18 3 1 多層感知器演算法 18 3 2 卷積神經網路 18 3 3 循環神經網路 18 3 4 長短期記憶神經網路 18 3 5 端到端神經網路 18 3 6 生成對抗網路 1 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |