一. 什么是知识图谱
- 知识图谱:是一种对知识间的关联进行建模的方法,目的是将这些关联关系的逻辑显示地表示出来。
- 三元组是知识图谱的基本元素,表达的是两个知识点之间的关系,因此被称为关系三元组。
- 它由三个部分组成,即 <实体,关系,实体>,基于位置,实体又可分为头实体和尾实体。eg:<水调歌头,谈及,苏轼>当中,水调歌头是头实体;苏轼是尾实体。
- 刻画一个知识点,不能仅仅用几个字来表示,而要从不同的维度来描绘,这些不同维度的描述信息被表示为实体属性。eg:<生日,1037年1月8日>、<性别,男>。对于这种属性,可以对他们进行拉平,形成形似三元组的格式,并被成为属性三元组。eg:<苏轼,生日,1037年1月8日>
二. DIKW模型
-
DIKW模型,即数据(Data)、信息(Information)、知识(Knowledge)、智慧(Wisdom)。
-
数据是原始的、杂乱无章的,用来表示现实世界中抽象对的或具体的事物。
-
对数据加以清洗、治理、分析,并以一定结构组织起来,就形成了信息,其结果就体现为知识图谱中的实体。
-
信息与信息之间的关联比较弱,但信息自身层次结构和内容比较丰富,因此我们可以认为信息是一个个点状的知识-----知识点。
-
将信息进行连接,形成知识。即知识是由无数知识点及其关联关系所构成的网状形态表示。
-
知识相对于信息,以及信息相对于数据,处理完之后即形成知识图谱,有两个关键环节:
-
1.领域实践经验: 在实践中对数据或信息进行语义理解,抽象总结成能够为推理决策等思维活动所使用的内容,从杂乱无章到规则有序的过程。
2.建立信息或知识点之间的连接,连接的关键取决于大脑的思维活动。大脑的思维活动体现为联想机制。 -
智慧表示的是对知识的应用,同时知识的应用往往还会产生新的知识,并且思维活动还会将产生的新知识加入已有的知识网络中。
三. 知识图谱技术体系
- 构建技术:
映射式构建技术:结构化数据到目标知识图谱的构建技术
抽取式构建技术: 非结构化到目标知识图谱的构建过程中用到的技术 - 知识融合:
狭义的知识融合:对相同知识点的不同文字描述的融合。 eg:同义词,近义词…
广义的知识融合:不仅需要满足狭义的知识融合要求,还需要融合多媒体、向量等表现形式。eg:目标的卡通样式、不同人对目标用不同语言进行朗读的声音。 - 应用技术:
快应用:运算简单低能耗。
慢应用:运算复杂且需要较多计算资源和能耗。
四. 知识图谱辨析
I. 知识图谱与自然语言处理
- 由于当前知识图谱中,知识的来源几乎都与文字有关,而处理文字的人工智能技术就是自然语言处理,所以很容易将二者混为一谈。
- 随着多模态知识图谱、脑科学与知识图谱、向量数据库、神经符号网络等有关的研究越来越多,越来越深,自然语言处理在知识图谱领域的比重会逐渐降低。
II. 知识图谱与图数据库
- 二者的关系相当于关系数据库和搜索引擎,会用关系数据库进行查询操作但不会将关系数据库看作是搜索引擎。
- 在实践中,知识图谱会用到图数据库,但知识图谱的核心还包括处理知识的语义关系,而这部分不是图数据库擅长的。
III. 知识图谱与语义网络
- 知识图谱是从语义网络衍生出来的,取其精华,去其糟粕。
- 语义网络是一种将知识与逻辑紧密结合的知识表示方式。
IV. 知识图谱与搜索引擎
- 搜索引擎致力于便捷获取,而知识图谱致力于基于知识的关联、推理和决策。
- 搜索引擎提供对非结构化数据的检索,而知识图谱则把非结构化数据当成数据的来源,系要经过抽取、萃取、关联和融合之后才能成为知识图谱的一部分。