检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。 “存储路径”:选择数据源文件存放在OBS桶的文件路径。 说明: 数据源存储的OBS路径不允许使用加密的OBS路径。
取项,抽取函数为${数据字段名}。 图标说明开关处于关闭状态,需要自定义填写信息抽取项。 在“信息抽取”对话框中填写信息抽取项: 每个表/文件中的数据需要设置一个唯一标识符identifier(可以抽取id/编号等可以唯一标识一条数据的内容)。例如,可以设置“url”为唯一标识符。
在创建知识图谱时,当您配置知识映射后,您需要配置知识融合,设置知识融合判断属性及相似度函数参数,完成新知识图谱的创建。 实体需要融合,因为有时候数据中会有多个实体对应现实世界中同一个事物,需要将这些实体合成一个。 父主题: 创建图谱
“选择数据源文件”:单击,弹出“选择数据源文件”对话框,选择数据源存放在OBS的路径: “OBS桶”:选择数据源文件存放的OBS桶“kg-model”。确保您使用的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 “存储路径”:选择数据源文件存放在OBS桶的文件路径“kg
需要同时授予依赖服务的角色,KG服务的权限才能生效。 KG服务依赖OBS服务的“列举对象”和“下载文件”操作,请参考OBS权限管理为KG服务角色开通具有“列举对象”和“下载文件”操作权限的OBS服务角色。
每组可选择多个属性判断相似度。 选择属性的时候,可以选择能够通过判断属性的相似度函数值就能判断出来两个实体是否相似的属性。例如对某一指代人物的实体,判断两个实体的属性“name”和“职业”的相似度均满足阈值,就可判断这两个实体实际上指代的是一个实体。 每组可添加多个判断融合的属性,最多添加9个。
配置知识融合时,如何选择融合标识符和配置属性 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1
如果在创建图谱时配置了知识融合,存在被融合的实体,就需要进行融合验证,即验证当前知识融合的配置产生的结果是否符合预期。 背景介绍 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的
什么是知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
接近特定客户的要求,或满足不同地区的法律或其他要求。 可用区 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的
体。 预览本体:创建本体后,预览描述本体信息的结构图。 编辑本体:创建本体后,编辑本体信息,更新本体。 导出本体:把创建的本体导出至OBS文件夹中。 删除本体:删除已创建的本体,以适应业务变化。 创建本体方式 方式一:控制台创建本体 方式二:OBS导入本体 父主题: 管理本体
label 否 String 希望输出的概念类型。 最小长度:0 最大长度:512 sources 否 String 实体id,可以是多个。但不能超过10个。多个用“,”间隔。 最小长度:0 最大长度:750 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 total
400 KGP.1002 本体被占用。 本体被占用。 释放本体。 400 KGP.1003 导入本体格式错误。 导入本体格式错误。 检查导入文件格式。 400 KGP.2001 未找到图谱。 未找到图谱。 检查图谱ID。 400 KGP.2002 无法删除图谱。 无法删除图谱。 图谱任务执行中无法删除。
ate”、宾语“Object_type”,即可查看到可抽取的主语、谓语、宾语组合。 图2 抽取模型 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 后续操作 配置信息抽取后,进入创建图谱的下一步操作配置知识映射。 父主题:
的“元素类型”,例如“概念”,输入“概念名”。可添加多个元素,元素类型请见表1。 图3 添加元素 表1 添加元素 元素类型 字段说明 概念 配置问答模板中所包含的概念,填写“概念名”,必须是当前知识图谱存在的概念名。可添加多个概念名,每输入一个概念名按Enter键结束。 概念属性
在“代码编辑”页签编辑json代码配置信息抽取时,可单击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示:
配置实体的关系映射:在对应实体下方的“关系映射”区域填写映射到各个实体关系的“抽取项”和“尾实体类型”。 单击“保存”,完成知识映射。 如果创建多个数据源,请完成所有数据源的知识映射配置。配置数据源请参见配置数据源。 示例 以创建一个有关于电影的知识图谱为例,展示如何在创建图谱时配置知识映射。
本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图2所示。 图2 实体电影的知识映射关系 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图3所示的两条数据,这两条数据中的
知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系。 通过设置映射前后的相关字段,完成知识映射的信息配置。 配置知识映射 配置知识融合 - 知识融合来自多个数据来源的关于同一个实体或概念的描述信息。 通过设置知识融合相关属性及相似函数参数,完成知识融合的信息配置。 配置知识融合 配置图谱质检 -