知識圖譜:方法、實踐與應用
  • 推薦0
  • 收藏5
  • 瀏覽885

知識圖譜:方法、實踐與應用

陳華鈞 , 王昊奮 , 漆桂林 (作者)  宋亞東 (責任編輯)

  • 書  號:978-7-121-36671-0
  • 出版日期:2019-08-01
  • 頁  數:480
  • 開  本:16(185*235)
  • 出版狀態:圖書立項
  • 維護人:宋亞東

相關圖書

機器學習互聯網業務安全實踐

王帥 吳哲夫 (作者)

互聯網產業正在從IT時代邁入DT時代(數據時代),同時互聯網產業的繁榮也催生了黑灰產這樣的群體。那么,在數據時代應該如何應對互聯網業務安全威脅?機器學習技術在互...

 

實戰深度學習算法:零起點通關神經網絡模型(基于Python和NumPy實現)

徐彬 (作者)

深度學習是機器學習的重要分支。本書系統地介紹了如何用 Python 和 NumPy 一步步地實現深度學習的基礎模型,無須借助 TensorFlow、PyTorc...

 

深度學習之TensorFlow工程化項目實戰

李金洪 (作者)

這是一本非常全面的、專注于實戰的AI 圖書,兼容TensorFlow 1.x 和2.x 版本,共75 個實例。 全書共分為5 篇:第1 篇,介紹了學習準備、搭...

 

OpenCV輕松入門:面向python

李立宗 (作者)

本書基于面向 Python 的 OpenCV(OpenCV for Python),介紹了圖像處理的方方面面。本書以 OpenCV 官方文檔的知識脈絡為主線,并...

 

聊天機器人:對話式體驗產品設計

Amir Shevat (作者) 淘寶(中國)軟件有限公司 (譯者)

從亞馬遜的Alexa語音助手到蘋果的Siri,從Slack的聊天機器人到短信和電子郵件機器人,我們越來越依賴于軟件驅動的聊天應用。在這本實用指南中,作者Amir...

¥65.00

自然語言處理實踐:聊天機器人技術原理與應用

王昊奮 等 (作者)

聊天機器人作為人工智能技術的殺手級應用,發展得如火如荼,各種智能硬件層出不窮。《自然語言處理實踐:聊天機器人技術原理與應用》系統地闡述了聊天機器人的分類和關鍵技...

¥39.00
知識圖譜是較為典型的多學科交叉領域,涉及知識工程、自然語言處理、機器學習、圖數據庫等多個領域。本書系統地介紹知識圖譜涉及的關鍵技術,如知識建模、關系抽取、圖存儲、自動推理、圖譜表示學習、語義搜索、知識問答、圖挖掘分析等。此外,本書還嘗試將學術前沿和實戰結合,讓讀者在掌握實際應用能力的同時對前沿技術發展有所了解。
本書既適合計算機和人工智能相關的研究人員閱讀,又適合在企業一線從事技術和應用開發的人員學習,還可作為高等院校計算機或人工智能專業師生的參考教材。
揭秘知識圖譜全生命周期技術,探索垂直領域知識圖譜構建方法與應用落地,促進人工智能從感知時代向認知時代跨越
王昊奮,上海交通大學計算機博士。中文知識圖譜zhishi.me創始人、OpenKG發起人之一、CCF理事、CCF術語審定工委主任、CCF TF執委、中文信息學會語言與知識計算專委會副秘書長、上海交通大學校友會AI分會秘書長。在知識圖譜、問答系統和聊天機器人等諸多領域有豐富的研發經驗。

漆桂林,東南大學計算機學院教授、東南大學認知智能研究所所長、南京柯基數據科技有限公司首席科學家、OpenKG發起人之一、中國中文信息學會語言與知識計算專業委員會副主任、中國科學技術情報學會知識組織專業委員會副主任、愛思唯爾(Elsevier)數據管理顧問委員會顧問、國際期刊 Journal of Data Intelligence 執行主編。科研成果在電力故障智能檢測和知識推送、醫藥知識問答及網絡安全態勢感知系統等領域得到了實際應用。

陳華鈞,浙江大學計算機科學與技術學院教授。浙江大學阿里巴巴知識引擎聯合實驗室負責人、浙江省大數據智能計算重點實驗室副主任、中國人工智能學會知識工程與分布智能專業委員會副主任委員、中國中文信息學會語言與知識計算專業委員會副主任委員、OpenKG發起人。曾獲國際語義網會議ISWC最佳論文獎。
前言

知識圖譜的早期理念源于萬維網之父Tim Berners-Lee關于語義網(The Semantic Web)的設想,旨在采用圖結構(Graph Structure)來建模和記錄世界萬物之間的關聯關系和知識,以便有效實現更加精準的對象級搜索。知識圖譜的相關技術已經在搜索引擎、智能問答、語言理解、推薦計算、大數據決策分析等眾多領域得到廣泛的實際應用。近年來,隨著自然語言處理、深度學習、圖數據處理等眾多領域的飛速發展,知識圖譜在自動化知識獲取、知識表示學習與推理、大規模圖挖掘與分析等領域又取得了很多新進展。知識圖譜已經成為實現認知層面的人工智能不可或缺的重要技術之一。

為什么寫作本書
知識圖譜是較為典型的交叉領域,涉及知識工程、自然語言處理、機器學習、圖數據庫等多個領域。而知識圖譜的構建及應用涉及更多細分領域的一系列關鍵技術,包括:知識建模、關系抽取、圖存儲、自動推理、圖譜表示學習、語義搜索、智能問答、圖計算分析等。做好知識圖譜需要系統掌握和應用這些分屬多個領域的技術。

本書寫作的第一個目的是盡可能地梳理和組織好這些知識點,幫助讀者系統掌握相關技術,能夠從整體、全局和系統的視角看待和應用知識圖譜技術。早期的知識圖譜應用主要是谷歌、百度等公司的通用域搜索引擎,以及基于搜索延續發展出來的基于知識圖譜的智能問答應用,如天貓精靈、小米小愛等。這類應用主要依靠通用領域的知識圖譜,如百科類知識圖譜。近年來,知識圖譜在醫療、金融、安全等垂直領域深入發展,知識圖譜的應用也進一步從通用領域向越來越多的垂直領域擴展。對于剛剛進入該領域的從業人員,更需要能從應用入手,開展知識圖譜的研究與開發。

本書寫作的第二個目的是希望能夠為這些知識圖譜應用開發人員提供一本參考型的工具書。因此,本書在章節最后安排了一個小節介紹相關技術點的常用開源工具,并在與本書配套的網站上提供了完整的實際操作教程。

近幾年,隨著人工智能的進一步發展,知識圖譜在深度知識抽取、表示學習與機器推理、基于知識的可解釋性人工智能、圖譜挖掘與圖神經網絡等領域取得了一系列新的進展。本書寫作的第三個目的是希望梳理和整理這些與知識圖譜相關領域的最新進展,幫助讀者了解它們的技術發展前沿。

關于本書作者
本書邀請了國內從事相關領域研究和開發的一線專家。三位主編都在語義網和知識圖譜領域有著十余年的研究和開發經驗,同時也是中文領域開放知識圖譜OpenKG的發起人。每個章節由各細分技術領域的專家主持撰寫,參與編寫的編者既有來自國內高校從事相關學術研究的教師,也有來自企業擁有豐富實際開發經驗的技術專家。

本書主要內容
本書共包括9章,主要內容如下:
第1章主要介紹知識圖譜的基本概念、歷史淵源、典型的知識圖譜項目、技術要素以及核心應用價值。
第2章圍繞知識表示與建模,首先介紹傳統人工智能領域的典型知識表示方法,如謂詞邏輯、描述邏輯、框架系統等,接下來重點介紹RDF、OWL等互聯網時代的知識表示框架,此外還介紹知識圖譜的向量表示方法等。最后以Protégé為例介紹知識建模的具體實踐過程。
第3章圍繞知識存儲,首先介紹知識圖譜存儲的主要特點和難點,然后介紹幾種常用的知識圖譜存儲索引及存儲技術,并對原生圖數據庫的技術原理進行簡要介紹。此外,還概要介紹常用的圖數據庫,并以Apache Jena和gStore為例介紹知識圖譜存儲的具體實踐過程。
第4章圍繞知識抽取與知識挖掘,首先介紹從不同來源獲取知識圖譜數據的常用方法,然后重點圍繞實體抽取、關系抽取和事件抽取等,對從文本中獲取知識圖譜數據的方法展開了較為具體的介紹。最后以DeepDive開源工具為例介紹關系抽取的具體實踐過程。
第5章圍繞知識圖譜的融合,分別對概念層的融合和實體層的融合展開介紹,包括本體映射、語義映射技術、實體對齊、實體鏈接等。最后以LIMES開源工具為例介紹實體融合的具體實踐過程。
第6章圍繞知識圖譜推理,首先介紹推理的基本概念,然后分別從基于演繹邏輯的知識圖譜推理和基于歸納的知識圖譜推理,對常用的知識圖譜推理技術進行介紹。最后以Apache Jena和Drools等開源工具為例介紹知識圖譜推理的具體實踐過程。
第7章和第8章分別圍繞語義搜索和知識問答展開,介紹語義索引、基于知識圖譜的問答等系列技術,并以gAnswer等開源工具為例,介紹基于知識圖譜實現精準搜索和問答的具體實踐過程。
第9章為應用案例章節,作者挑選了電商、圖情、生活娛樂、企業商業、創投、中醫臨床領域和金融證券行業7個應用案例,對知識圖譜技術在不同領域的實現過程和應用方法展開介紹。

如何閱讀本書
這是一本大厚書,讀者應該怎樣利用這本書呢?
在閱讀此書前,讀者應當學過數據庫、機器學習及自然語言處理的基本知識。這本書的章節是依據知識圖譜的相關技術點進行安排的。由于知識圖譜涉及的技術面較多,我們建議剛進入知識圖譜領域的讀者分幾遍閱讀本書。
1)第一遍先通讀全書,主要厘清基本概念,對涉及學術前沿的內容以及開源工具實踐部分的內容可以只簡單瀏覽。
2)第二遍重點針對每個章節后面的開源工具進行實踐學習,通過上手操作加深對各技術點的理解。
3)第三遍針對各章中介紹的算法進行學習,并結合相關論文的閱讀加深對算法的理解。在這個階段可以挑選自己感興趣的技術點進行深入研究。
在撰寫本書時,編者考慮了各章節技術點的獨立性,對知識圖譜的某些技術已經有些了解的讀者,可以不用嚴格按照書的章節順序閱讀,而是挑選自己感興趣的章節進行學習。

致謝
本書是很多人共同努力的成果,在此感謝各位編者的共同努力。同時,在本書寫作過程中,北京大學的鄒磊,湖南大學的彭鵬,海知智能的袁熙昊、韓廬山、王燚鵬、孫勝男、郭玉婷,東南大學的吳桐桐、譚亦鳴、花云程、胡森,浙江大學的張文、王冠穎、王若旭、陳名楊、王梁、葉志權等人也提供了非常有價值的調研結果和修改意見,在此表示衷心的感謝。
在電子工業出版社博文視點宋亞東編輯的熱情推動下,最終促成了我們與電子工業出版社的合作。在審稿過程中,他多次邀請專家對此書提出有益意見,對書稿的修改完善起到了重要作用。在此感謝電子工業出版社博文視點和宋亞東編輯對本書的重視,以及為本書出版所做的一切。
為推動中文領域開放知識圖譜的發展,本書的作者們一致同意將部分稿酬捐贈給OpenKG。在此,也對參與本書的所有作者的無私奉獻表示感謝。
由于作者水平有限,書中不足及錯誤之處在所難免。此外,由于知識圖譜技術涉及面廣,本書難免有所遺漏,敬請專家和讀者給予批評指正。

作者
2019年7月

目錄

第1章 知識圖譜概述 1
1.1 什么是知識圖譜 1
1.2 知識圖譜的發展歷史 2
1.3 知識圖譜的價值 5
1.4 國內外典型的知識圖譜項目 9
1.4.1 早期的知識庫項目 9
1.4.2 互聯網時代的知識圖譜 9
1.4.3 中文開放知識圖譜 12
1.4.4 垂直領域知識圖譜 13
1.5 知識圖譜的技術流程 15
1.6 知識圖譜的相關技術 19
1.6.1 知識圖譜與數據庫系統 19
1.6.2 知識圖譜與智能問答 23
1.6.3 知識圖譜與機器推理 25
1.6.4 知識圖譜與推薦系統 28
1.6.5 區塊鏈與去中心化的知識圖譜 29
1.7 本章小結 30
參考文獻 31

第2章 知識圖譜表示與建模 40
2.1 什么是知識表示 40
2.2 人工智能早期的知識表示方法 43
2.2.1 一階謂詞邏輯 43
2.2.2 霍恩子句和霍恩邏輯 43
2.2.3 語義網絡 44
2.2.4 框架 45
2.2.5 描述邏輯 47
2.3 互聯網時代的語義網知識表示框架 48
2.3.1 RDF和RDFS 48
2.3.2 OWL和OWL2 Fragments 53
2.3.3 知識圖譜查詢語言的表示 59
2.3.4 語義Markup表示語言 62
2.4 常見開放域知識圖譜的知識表示方法 64
2.4.1 Freebase 64
2.4.2 Wikidata 65
2.4.3 ConceptNet5 66
2.5 知識圖譜的向量表示方法 68
2.5.1 知識圖譜表示的挑戰 68
2.5.2 詞的向量表示方法 68
2.5.3 知識圖譜嵌入的概念 71
2.5.4 知識圖譜嵌入的優點 72
2.5.5 知識圖譜嵌入的主要方法 72
2.5.6 知識圖譜嵌入的應用 75
2.6 開源工具實踐:基于Protégé的本體知識建模 77
2.6.1 簡介 77
2.6.2 環境準備 78
2.6.3 Protégé實踐主要功能演示 78
2.7 本章小結 80
參考文獻 80

第3章 知識存儲 82
3.1 知識圖譜數據庫基本知識 82
3.1.1 知識圖譜數據模型 82
3.1.2 知識圖譜查詢語言 85
3.2 常見知識圖譜存儲方法 91
3.2.1 基于關系數據庫的存儲方案 91
3.2.2 面向RDF的三元組數據庫 101
3.2.3 原生圖數據庫 115
3.2.4 知識圖譜數據庫比較 120
3.3 知識存儲關鍵技術 121
3.3.1 知識圖譜數據庫的存儲:以Neo4j為例 121
3.3.2 知識圖譜數據庫的索引 124
3.4 開源工具實踐 126
3.4.1 三元組數據庫Apache Jena 126
3.4.2 面向RDF的三元組數據庫gStore 128
參考文獻 131

第4章 知識抽取與知識挖掘 133
4.1 知識抽取任務及相關競賽 133
4.1.1 知識抽取任務定義 133
4.1.2 知識抽取相關競賽 134
4.2 面向非結構化數據的知識抽取 136
4.2.1 實體抽取 137
4.2.2 關系抽取 142
4.2.3 事件抽取 150
4.3 面向結構化數據的知識抽取 154
4.3.1 直接映射 154
4.3.2 R2RML 156
4.3.3 相關工具 159
4.4 面向半結構化數據的知識抽取 161
4.4.1 面向百科類數據的知識抽取 161
4.4.2 面向Web網頁的知識抽取 165
4.5 知識挖掘 168
4.5.1 知識內容挖掘:實體鏈接 168
4.5.2 知識結構挖掘:規則挖掘 174
4.6 開源工具實踐:基于DeepDive的關系抽取實踐 178
4.6.1 開源工具的技術架構 178
4.6.2 其他類似工具 180
參考文獻 180

第5章 知識圖譜融合 184
5.1 什么是知識圖譜融合 184
5.2 知識圖譜中的異構問題 185
5.2.1 語言層不匹配 186
5.2.2 模型層不匹配 187
5.3 本體概念層的融合方法與技術 190
5.3.1 本體映射與本體集成 190
5.3.2 本體映射分類 192
5.3.3 本體映射方法和工具 195
5.3.4 本體映射管理 232
5.3.5 本體映射應用 235
5.4 實例層的融合與匹配 236
5.4.1 知識圖譜中的實例匹配問題分析 236
5.4.2 基于快速相似度計算的實例匹配方法 240
5.4.3 基于規則的實例匹配方法 241
5.4.4 基于分治的實例匹配方法 244
5.4.5 基于學習的實例匹配方法 260
5.4.6 實例匹配中的分布式并行處理 266
5.5 開源工具實踐:實體關系發現框架LIMES 266
5.5.1 簡介 266
5.5.2 開源工具的技術架構 267
5.5.3 其他類似工具 269
5.6 本章小結 269
參考文獻 269

第6章 知識圖譜推理 279
6.1 推理概述 279
6.1.1 什么是推理 279
6.1.2 面向知識圖譜的推理 282
6.2 基于演繹的知識圖譜推理 283
6.2.1 本體推理 283
6.2.2 基于邏輯編程的推理方法 288
6.2.3 基于查詢重寫的方法 295
6.2.4 基于產生式規則的方法 301
6.3 基于歸納的知識圖譜推理 306
6.3.1 基于圖結構的推理 306
6.3.2 基于規則學習的推理 313
6.3.3 基于表示學習的推理 318
6.4 知識圖譜推理新進展 324
6.4.1 時序預測推理 324
6.4.2 基于強化學習的知識圖譜推理 325
6.4.3 基于元學習的少樣本知識圖譜推理 326
6.4.4 圖神經網絡與知識圖譜推理 326
6.5 開源工具實踐:基于Jena和Drools的知識推理實踐 327
6.5.1 開源工具簡介 327
6.5.2 開源工具的技術架構 327
6.5.3 開發軟件版本及其下載地址 328
6.5.4 基于Jena的知識推理實踐 328
6.5.5 基于Drools的知識推理實踐 329
6.6 本章小結 329
參考文獻 330

第7章 語義搜索 334
7.1 語義搜索簡介 334
7.2 結構化的查詢語言 336
7.2.1 數據查詢 338
7.2.2 數據插入 341
7.2.3 數據刪除 341
7.3 語義數據搜索 342
7.4 語義搜索的交互范式 348
7.4.1 基于關鍵詞的知識圖譜語義搜索方法 348
7.4.2 基于分面的知識圖譜語義搜索 350
7.4.3 基于表示學習的知識圖譜語義搜索 352
7.5 開源工具實踐 355
7.5.1 功能介紹 355
7.5.2 環境搭建及數據準備 357
7.5.3 數據準備 357
7.5.4 導入Elasticsearch 360
7.5.5 功能實現 361
7.5.6 執行查詢 363
參考文獻 364

第8章 知識問答 366
8.1 知識問答概述 366
8.1.1 知識問答的基本要素 366
8.1.2 知識問答的相關工作 367
8.1.3 知識問答應用場景 369
8.2 知識問答的分類體系 371
8.2.1 問題類型與答案類型 371
8.2.2 知識庫類型 374
8.2.3 智能體類型 375
8.3 知識問答系統 376
8.3.1 NLIDB:早期的問答系統 376
8.3.2 IRQA:基于信息檢索的問答系統 380
8.3.3 KBQA:基于知識庫的問答系統 380
8.3.4 CommunityQA/FAQ-QA:基于問答對匹配的問答系統 381
8.3.5 Hybrid QA Framework 混合問答系統框架 382
8.4 知識問答的評價方法 386
8.4.1 問答系統的評價指標 386
8.4.2 問答系統的評價數據集 387
8.5 KBQA前沿技術 392
8.5.1 KBQA面臨的挑戰 392
8.5.2 基于模板的方法 394
8.5.3 基于語義解析的方法 398
8.5.4 基于深度學習的傳統問答模塊優化 401
8.5.5 基于深度學習的端到端問答模型 405
8.6 開源工具實踐 406
8.6.1 使用Elasticsearch搭建簡單知識問答系統 406
8.6.2 基于gAnswer構建中英文知識問答系統 410
8.7 本章小結 415
參考文獻 416

第9章 知識圖譜應用案例 420
9.1 領域知識圖譜構建的技術流程 420
9.1.1 領域知識建模 421
9.1.2 知識存儲 422
9.1.3 知識抽取 422
9.1.4 知識融合 423
9.1.5 知識計算 423
9.1.6 知識應用 424
9.2 領域知識圖譜構建的基本方法 425
9.2.1 自頂向下的構建方法 425
9.2.2 自底向上的構建方法 426
9.3 領域知識圖譜的應用案例 428
9.3.1 電商知識圖譜的構建與應用 428
9.3.2 圖情知識圖譜的構建與應用 431
9.3.3 生活娛樂知識圖譜的構建與應用:以美團為例 435
9.3.4 企業商業知識圖譜的構建與應用 440
9.3.5 創投知識圖譜的構建與應用 443
9.3.6 中醫臨床領域知識圖譜的構建與應用 448
9.3.7 金融證券行業知識圖譜應用實踐 452
9.4 本章小結 460
參考文獻 461

本書勘誤

印次
  • 頁碼:3  •  行數:7  •  印次: 1  •  修訂印次: 3

    圖1-2 從語義網絡到知識圖譜。Tim Berners-Lee提出四條鏈接規則是在2006年,圖片中是1989年
    參見鏈接https://www.w3.org/DesignIssues/LinkedData.html

    一軒明月 提交于 2019/9/17 10:14:14
    宋亞東 確認于 2019/9/18 10:53:20
  • 頁碼:5  •  行數:4  •  印次: 1  •  修訂印次: 2

    [25]沒有弄成上標

    Angolin 提交于 2019/9/15 16:21:36
    宋亞東 確認于 2019/9/16 11:12:21
  • 頁碼:52  •  行數:4  •  印次: 1  •  修訂印次: 3

    3.RDFS簡介排版不對

    Angolin 提交于 2019/9/15 16:23:43
    宋亞東 確認于 2019/9/16 11:17:50
  • 頁碼:53  •  行數:圖2-14  •  印次: 1  •  修訂印次: 3

    圖2-14里面的spraker應該為speaker

    Angolin 提交于 2019/9/15 16:25:22
    宋亞東 確認于 2019/9/16 11:19:32
  • 頁碼:57  •  行數:10和表2-7  •  印次: 1  •  修訂印次: 3

    表2-7的名稱應該是owl 2 EL 詞匯總結

    Angolin 提交于 2019/9/15 19:05:39
    宋亞東 確認于 2019/9/16 11:22:07

讀者評論

  • 3.4.1,本實踐相關工具、實驗數據及操作說明由OpenKG提供,地址為http://openkg.cn。
    然后我在上面的網站,只找到了相關工具jena,只有官網鏈接。沒有看到實驗數據及操作說明。

    富光八百發表于 2019/9/16 22:06:03
    • 您好,所有數據已經在OpenKG官網更新,地址為http://www.openkg.cn/dataset/kg-book。謝謝您!

      宋亞東發表于 2019/10/12 15:39:13
  • 請問提交勘誤是在哪里提交

    Angolin發表于 2019/9/10 20:57:10
    • 您好,勘誤可在本頁提交,提交后我們能在后臺看到,謝謝您!

      宋亞東發表于 2019/9/12 9:40:09
  • 請問咱這本書有電子版嗎

    GinSoda發表于 2019/8/28 20:02:28
    • 本書會有電子版,敬請關注!電子版將在kindle、京東、當當、豆瓣閱讀等平臺售賣。

      宋亞東發表于 2019/9/4 8:55:44

相關博文

  • AI進步的階梯《知識圖譜:方法、實踐與應用》開啟預售!

    AI進步的階梯《知識圖譜:方法、實踐與應用》開啟預售!

    管理員賬號 2019-08-12

    互聯網促成了大數據的集聚,大數據進而促進了人工智能算法的進步。近年來知識圖譜作為AI領域底層技術被越來越多的人談起。知識圖譜的升溫得益于新數據和新算法為規模化知識圖譜構建提供了新的技術基礎和發展條件,使得知識圖譜構建的來源、方法和技術...

    管理員賬號 2019-08-12
    98 0 0 0
  • 分享實錄丨陽德青教授分享“知識圖譜起航”

    分享實錄丨陽德青教授分享“知識圖譜起航”

    管理員賬號 2019-08-19

    知識圖譜是實現機器人之智能的基礎,也是一門應用廣泛的工程學科。其具體方法大都來自計算機或人工智能的其他領域,比如自然語言處理、機器學習、知識工程等。面對如此龐雜的知識,初學者應該如何著手? 日前,我們邀請復旦大學大數據學院與大數據...

    管理員賬號 2019-08-19
    70 0 0 0
0k000澳客网竞彩