检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么是字段抽取函数 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在通过普通抽取方式进行信息抽取时,即用交互界面配置或用格式化编辑进行信息抽取时,需要配置字段抽取函数。配置
知识融合需要初步筛选与融合标识符相似的实体数据。 判断属性相似度 初步筛选与融合标识符相似的数据后,需要配置相似属性和相似度函数,并判断数据之间的属性相似度。 融合知识 对属性相似度均达到阈值条件的数据进行融合。 综上所述,在创建图谱的过程中,需要配置知识融合的融合标识符、待融合的实体、相似度函数和相
选择属性的时候,可以选择能够通过判断属性的相似度函数值就能判断出来两个实体是否相似的属性。例如对某一指代人物的实体,判断两个实体的属性“name”和“职业”的相似度均满足阈值,就可判断这两个实体实际上指代的是同一个实体。 具体选择什么属性来做这个判断,还要看您业务数据的实际情况。 父主题:
什么是信息抽取 什么是字段抽取函数 什么是知识映射 什么是知识融合 怎样配置实体唯一标识字段 配置知识融合时,如何选择融合标识符和配置属性 属性融合依据的是哪一步的数据来配置的 配置信息抽取后,为什么查询不到实体数据 为何知识图谱无法运行,提示“错误的信息抽取函数” 配置完图谱,运行时报错“OBS对象不存在”怎么办
预览查询知识图谱 预览图谱 新建实体/关系
管理图谱 如何全量更新图谱 如何查看图谱中的整个实体关系 如何增量更新图谱 图谱版本更新后,历史版本是否支持图谱预览
什么是信息抽取 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围
名称 描述 Content-Length 响应消息体的字节长度,单位为Byte。 Date 系统响应的时间。 Content-type 发送的实体的MIME类型。 父主题: 数据结构
系名”、“头实体概念”和“尾实体概念”,必须是当前知识图谱存在的“关系名”、“头实体概念”和“尾实体概念”。 实体 配置问答模板中所包含的实体,填写“实体名”和“所属概念名”,必须是当前知识图谱存在的“实体名”和“所属概念名”。 实体属性值 配置问答模板中所包含的实体属性值,填写
单击实体“人物”对应的图标。 填写实体“人物”映射前的抽取项:“Person”。 填写映射到实体“人物”抽取项,如图16和表5所示。 图16 实体人物的抽取项 表5 实体人物的抽取项 属性 抽取项 name 中文名 国籍 国籍 职业 职业 出生日期 出生日期 单击“保存”,完成知识映射配置。
单击实体“人物”对应的图标。 填写实体“人物”映射前的抽取项:“Person”。 填写映射到实体“人物”抽取项,如图16和表5所示。 图16 实体人物的抽取项 表5 实体人物的抽取项 属性 抽取项 name 中文名 国籍 国籍 职业 职业 出生日期 出生日期 单击“保存”,完成知识映射配置。
“待融合属性”指判断两个实体相似度所依据的实体属性,每组可选择多个属性判断相似度。 选择属性的时候,可以选择能够通过判断属性的相似度函数值就能判断出来两个实体是否相似的属性。例如对某一指代人物的实体,判断两个实体的属性“name”和“职业”的相似度均满足阈值,就可判断这两个实体实际上指代的是一个实体。
关系ID,格式为“source(头实体ID)-target(尾实体ID)-index(关系索引值)”,如“4730302-1963128-1”,表示ID为4730302的实体和ID为1963128的实体之间的第1个关系。 index String 关系的索引值,标识该条关系是其头尾实体的第几个关系。
融合验证 如果在创建图谱时配置了知识融合,存在被融合的实体,就需要进行融合验证,即验证当前知识融合的配置产生的结果是否符合预期。 背景介绍 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两
格配置模式”,填写知识映射的相关信息。 单击实体“Person”对应的图标。 填写实体“Person”映射前的抽取项:“人物”。 填写映射到实体“Person”的抽取项,如图14和表3所示。 图14 实体Person的抽取项 表3 实体Person的抽取项 属性/关系名称 抽取项
在图谱预览页面,您可以查看到所搜索的实体信息。 图3 预览图谱 功能区 “预览图谱”页面右侧有功能区可进行如下操作。 :查看历史操作记录。 :放大查看图谱实体。 :缩小查看图谱实体。 :适配比例查看图谱。 :查看局部图谱的实体信息。 :以不同布局方式查看图谱和实体。 :保存图谱或实体图片至本地。如果
模板 举例说明 实体名称 月光宝盒 xx实体 + 呢 月光宝盒呢 xx实体 的 xx属性 月光宝盒的上映时间 xx实体属性 + 呢 上映时间呢 xx属性 是 xx值 的 xx实体类型 票房是10亿的电影 xx实体 的 xx关系(正向一跳关系) 月光宝盒的导演 xx实体 的 xx关系(正向一跳关系)+
配置实体的概念映射:在对应实体下方的“概念映射”区域填写映射前的实体类型字段。 配置实体的属性映射:在对应实体下方的“属性映射”区域填写映射到实体各个属性的“抽取项”。 配置实体的关系映射:在对应实体下方的“关系映射”区域填写映射到各个实体关系的“抽取项”和“尾实体类型”。 单击“保存”,完成知识映射。
在“知识映射”对话框,选择编辑方式为“表格配置模式”,填写知识映射的相关信息。 单击实体“Person”对应的图标。 填写实体“Person”映射前的抽取项:“人物”。 填写映射到实体“Person”的抽取项,如图9和表3所示。 图9 实体Person的抽取项 表3 实体Person的抽取项 属性/关系名称 抽取项 name
关系ID,格式为“source(头实体ID)-target(尾实体ID)-index(关系索引值)”,如“4730302-1963128-1”,表示ID为4730302的实体和ID为1963128的实体之间的第1个关系。 index String 关系的索引值,标识该条关系是其头尾实体的第几个关系。