检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么是知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
知识图谱的计费规格分一万边、百万边、千万边,其中一万边指代一万条关系,百万边和千万边以此类推,即图谱边的数量级达到一万、百万、千万,规模不同。 父主题: 计费问题
构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取 配置实体类型和对应数据字段信息。
构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取 配置实体类型和对应数据字段信息。
在“增量更新”页面,依次完成数据源配置、信息抽取、知识映射、知识融合、图谱质检的配置,详细的操作指引请见表1。 “增量更新”页面入口与“创建知识图谱”页面入口不同,但是增量更新中的配置操作均与创建知识图谱操作相同。 增量更新不支持更新本体,仅支持预览本体。 图1 增量更新 表1 增量更新图谱操作 操作顺序
在“增量更新”页面,依次完成数据源配置、信息抽取、知识映射、知识融合、图谱质检的配置,详细的操作指引请见表1。 “增量更新”页面入口与“创建知识图谱”页面入口不同,但是增量更新中的配置操作均与创建知识图谱操作相同。 增量更新不支持更新本体,仅支持预览本体。 图1 增量更新 表1 增量更新图谱操作 操作顺序
操作步骤 在普通配置构建图谱页面,单击“知识映射”,页面下方弹出“知识映射”对话框,单击右侧按钮可以放大对话框。 图1 知识映射 “编辑方式”选择“代码配置模式”。 在“代码配置模式”页签的编辑框中,输入json格式代码,以映射关系如图2为例,代码示例如下所示: 图2 实体人物的映射关系
信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在通过普通抽取方式进行信息抽取时,即用交互界面配置或用格式化编辑进行信息抽取时,需要配置字段抽取函数。配置字段抽取函数后,KG服务会根据所配置的字段抽取函数
登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击已创建图谱的名称,进入图谱详情页面,包含信息如图1所示。 图1 图谱详情 单击“预览图谱”,选择匹配方式: 选择“完全匹配”,输入“实体名称”,按回车进入图谱预览页面,预览该实体的知识图谱。 选择“模糊匹配”,输入实体名称部分字段,按回车进入
图1 信息抽取 在“创建图谱”页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框。 在“信息抽取”对话框中,“抽取方式”选择“结构化抽取”,“编辑方式”选择“交互界面”。 关闭“默认抽取”开关。 在“信息抽取”对话框中填写信息抽取项,按表1填写。 表1 信息抽取项示例 数据类别
配置完流水线的图谱,如何修改数据 已通过流水线配置完成构建的知识图谱,如果想要修改数据,可通过全量更新或增量更新图谱的方式,更新图谱。 全量更新图谱 针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。 增量更新图谱 针对已经创建的知识图谱,您可以增量更新图
操作步骤 在普通配置构建图谱页面,单击“知识映射”,页面下方弹出“知识映射”对话框,单击右侧按钮可以放大对话框。 图1 知识映射 “编辑方式”选择“表格配置模式”,填写知识映射的相关信息。 配置实体的概念映射:在对应实体下方的“概念映射”区域填写映射前的实体类型字段。 配置实体
知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。 代码配置模式:通过编辑json格式代码,
在图谱流水线配置页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 图1 流水线配置页面 在“信息抽取”对话框中,“抽取方式”默认为“非结构化抽取”。 根据自身业务需要,您可以选择“公有库模型”、“预置模型”或者“用户自定义模型”,三者仅需选择一项。 “公有库模