| *數量非實際在台庫存 *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為實際資訊。 印行年月:202311*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:R自然語言處理導論 ISBN:9787576609417 出版社:東南大學 著編譯者:鮑貴 頁數:307 所在地:中國大陸 *此為代購商品 書號:1601651 可大量預訂,請先連絡。 內容簡介 本著作以主題為導向,以問題為抓手,用十二章的篇幅系統介紹與討論了R在自然語言處理中的主要應用,幫助讀者在較短的時間內了解R、熟悉R和使用R。 本著作具有三大特點: 第一,內容全面。本著作不但介紹R軟體的安裝要領和各種功能,而且介紹常見的文本統計與測量方法,特別是基於整潔數據的自然語言處理技術。 第二,實踐性強。本著作充分踐行「發現式學習」和「做中學」的教學理念,通過設計和實施一個個具體的研究任務,幫助讀者在真實情景中掌握R自然語言處理技術。 第三,使用便捷。本著作對用戶友好,為讀者提供了多種可下載的數據包和詳細的代碼與說明,凸顯各個自然語言處理方法的重點和難點。目錄 第一章 R語言基礎1 1 R簡史 1 2 R軟體和數據包安裝 1 3 基本R對象 1 4 R循環 第二章 字元串處理 2 1 文檔讀取 2 2 字元串分割 2 3 正則表達式 2 4 R基礎包中的正則表達式函數 2 5 字元串操作數據包stringr 2 6 語境中的關鍵詞檢索 第三章 文本基礎統計 3 1 數據包koRpus的安裝與調試 3 2 描述性統計 3 3 詞彙密度 3 4 詞頻表 3 5 詞頻分布圖 第四章 文本詞彙多樣性測量 4 1 傳統的類符一形符比 4 2 平均分段類符一形符比 4 3 移動平均類符一形符比 4 4 Herdan's C 4 5 Guiraud's R 4 6 尤伯指數(U) 4 7 薩默指數(s) 4 8 Yule's K 4 9 Maas指數 4 10 HD 4 11 文本詞彙多樣性測量(MTLD) 4 12 文本詞彙多樣性移動平均測量(MTLD-MA) 第五章 文本可讀性測量 5 1 自動化可讀性指數(ARI) 5 2 科爾曼-廖指數 5 3 戴爾-喬爾可讀性新公式 5 4 弗萊什閱讀難易度 5 5 法爾-詹金斯-帕特森指數 5 6 弗萊什-金凱德年級水平 5 7 安德森可讀性指數 5 8 複雜詞詞頻修正指數 5 9 複雜詞簡單測量(SMOG) 5 10 聽力難易度公式 第六章 N元組和關鍵詞 6 1 文本數據計量分析數據包安裝與初試 6 2 兩個文本的二元組比較 6 3 兩個文本的三元組比較 6 4 文本比較關鍵詞提取 第七章 搭配和搭配構式 7 1 搭配和搭配構式分析方法 7 2 文本中的搭配分析案例 7 3 文本中的搭配構式分析案例 第八章 文本相似度和距離測量 8 1 詞彙相似度測量 8 2 語義相似度測量 8 3 文本相似度測量舉例 第九章 基於整潔文本的自然語言處理 9 1 作為新型數據框的tibble 9 2 整潔數據和數據包tidyr 9 3 管道操作和數據包dplyr 9 4 基於整潔數據的數據包tidytext 9 5 精美製圖數據包ggplot2 9 6 利用整潔數據的文本情感分析 9 7 對小說《傲慢與偏見》的文本特徵分析 第十章 中文自然語言處理 10 1 中文分詞 10 2 文檔基本描述性統計量 10 3 文本詞頻分佈詞雲圖 10 4 關鍵詞檢索 10 5 關鍵詞提取 10 6 中文情感分析 第十一章 詞性與句法分析 11 1 數據包udpipe的安裝與初試 11 2 文本中的短語提取 11 3 句法分析 11 4 詞語共現 兒 5 快速自動關鍵詞提取 第十二章 在R中調用Python開展自然語言處理 12 1 安裝Python和Python庫 12 2 R數據包reticulate的安裝和基礎操作 12 3 利用NLTK庫的自然語言處理 12 4 利用spaCy庫的自然語言處理 參考文獻 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |