请选择 进入手机版 | 继续访问电脑版

#楼主# 2020-7-23

跳转到指定楼层
知识图谱的架构包括知识图谱自身具备的逻辑架构和构建知识图谱采用的技术架构两部分,下面分别详细的来介绍这2部分内容。

tupu.jpeg

一、逻辑架构

知识图谱的逻辑架构可分为两个层次:数据层和模式层,如下图所示:

1.jpeg

1、数据层:是知识图谱的基础,由一系列的事实(Fact)组成。知识以事实为单位存储在图数据库中,例如 Google 的 Graphd 和微软的 Trinity 都是典型的图数据库。采用(实体,关系,实体)或(实体,属性,属性值)这样的三元组作为事实的基本表达方式,可以将存储在图数据库中的所有数据构建成庞大的实体关系网络,形成一个知识的「图谱」。

2、模式层:知识图谱的模式层在数据层之上,是知识图谱的核心。模式层存储的是经过提炼的知识。通常采用本体库管理模式层,借助本体库对公理、规则和约束条件的支持能力规范实体之间的联系。这里提到的「本体」是一个形式化的、对于共享概念模型明确而详细的规范说明。形式化指本体可通过各种形式化的语言进行描述,这种形式化的语言对于计算机来说都是可读、可操作的。共享指本体体现的是公认的知识,反映的是对相关领域中知识的共同理解。概念模型是将客观世界中一些现象的相关概念抽象出来得到的模型,这些概念及使用这些概念的约束都有明确的定义。本体库可以看成结构化知识库的一个模板,其精练而标准。拥有本体库的知识库层次结构强,且其中的冗余知识比较少。

二、技术架构

知识图谱的技术架构也被称为体系架构,是指其在构建知识图谱时选择的模式结构。知识图谱的构建从最原始的数据出发,采用一系列自动或者半自动的技术手段,从数据库中提取知识,并将其存入知识库的数据层和模式层。如下图所示:

2.jpeg

虚线框的左边是可以输入的 3 种数据结构:结构化数据(如关系数据库)、半结构化数据(如 XML)和非结构化数据(如图像、文本),数据来源没有限制;虚线框的右边是生成的知识图谱,这个过程循环往复,且随着人的认知能力的提升而不断更新迭代;虚线框内是知识图谱的构建过程,主要包含信息抽取、知识融合、知识加工 3 个阶段。

1、信息抽取:从各种类型的数据源中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达。
2、知识融合:在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应多个不同的实体等。
3、知识加工:经过融合的新知识需要经过质量评估之后(部分需要人工参与甄别),才能将合格的部分加入知识库中,以确保知识库的质量。





上一篇:"知识图谱"解决的核心问题:信息过载、信息缺失
下一篇:知识图谱构建方法论:“自顶向下”和“自底向上”
转播转播 分享淘帖
回复

使用道具

成为第一个回复人

AI产品经理
小黑屋|AI产品经理社 |京ICP备19051683号-1
Powered by 长弓PM   © 2019-2050