检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击下方“保存当前页”。 步骤4:发布数据集 在ModelArts管理控制台的左侧菜单栏中单击“数据管理>数据集”,进入数据集页面。 在数据集列表中,单击数据集“RelationExtraction”操作列的“发布”。 或者,您可以单击数据集名称,进入数据集概览页,在页面右上角单击“发布”。
在数据源配置对话框,填写相关信息。 “选择数据格式”:此样例选择“XLSX”。 “选择数据源文件”:单击,弹出“选择数据源文件”对话框,选择数据源存放在OBS的路径: “OBS桶”:选择数据源文件存放的OBS桶“kg-test”。确保您使用的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。
怎样配置实体唯一标识字段 实体唯一标识字段 实体唯一标识字段指能识别每个数据的唯一字段,该字段在所有数据中具有唯一性,能唯一代表所对应的数据,类似于数据的“身份证”。 例如如下数据的唯一标识字段为“url” ,因为该字段能唯一代表该数据,因此在配置实体唯一标识字段时,“唯一标识字段”的文本框中填写“url”。
配置知识融合时,如何选择融合标识符和配置属性 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 配置知识融合后,知识图谱服务会对数据按配置规则进行
在发布数据集时,“版本格式”选择“Default”。 ModelArts发布的标注数据集是“.manifest”格式的文件,其中包含多行,每行是一个JSON格式的标注样例。 前提条件 准备训练数据并上传至OBS目录,详细步骤请参见准备训练数据,数据类型和要求请见训练数据类型介绍。
弹出数据源配置对话框,单击右侧按钮可以放大对话框。 图10 配置数据源 在“数据源配置”对话框,填写相关信息。 “选择数据格式”:此样例选择“短文本”。 “选择数据源文件”:单击,弹出“选择数据源文件”对话框,选择数据源存放在OBS的路径: “OBS桶”:选择数据源文件存放的OB
什么是知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
什么是字段抽取函数 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在通过普通抽取方式进行信息抽取时,即用交互界面配置或用格式化编辑进行信息抽取时,需要配置字段抽取函数。配置
此仅适用于抽取基础数据格式为txt文本的自然语言短句。 自定义模型流程 自定义信息抽取模型的流程如表1所示。 表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据 提前准备用于训练模型的数据。 准备训练数据 创建模型 基于您的训练数据(即已标注数据),您可以在KG服务中创建信息抽取模型。
知识图谱的计费规格,一万条边、百万边、千万边具体指什么 知识图谱的数据存储在图数据库,图数据库基本数据类型包含点和边。 点代表实体。如交通网络中的车辆、通信网络中的站点、电商交易网络中的用户和商品、互联网中的网页等。 边代表关系。如社交网络中的好友关系、电商交易网络中用户评分和购
”。 单击“保存”,完成知识映射。 如果创建多个数据源,请完成所有数据源的知识映射配置。配置数据源请参见配置数据源。 示例 以创建一个有关于电影的知识图谱为例,展示如何在创建图谱时配置知识映射。 按配置数据源为待创建的图谱配置数据源。 按配置图谱本体为待创建的图谱选择本体。 按配
please! 处理方法:标注数据所在OBS路径无读取下载权限,请检查是否授权图谱服务读取标注数据所在OBS路径。 KG-RE.1050 错误信息:Annotation data is too low! 处理方法:合法的标注数据数量太少,模型无法训练,请标注更多数据。 错误信息:Train
待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。
API概览 KG服务提供接口请参见表1,您可以使用知识图谱数据面管理功能。 表1 知识图谱数据面接口 API 说明 执行知识图谱查询命令 根据图谱ID执行知识图谱查询命令。 查询实体详情 根据图谱ID和实体ID查询实体详情,包括实体的ID、类型、属性及属性值。 过滤查询实体列表
针对已经创建的知识图谱,您可以增量更新图谱,即在原有图谱的数据基础上增加新的数据更新知识图谱。 增量更新图谱 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片。 进入图谱详情页面。 单击右上角的“增量更新”。 进入“增量更新”页面,通过配置数据源、配置信息抽取、配置知识映射
什么是知识映射 建立从基础数据中抽取的结构化信息与所创建的知识图谱中的实体、属性、实体间相互关系的映射关系。 父主题: 创建图谱
引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。 表1 信息抽取函数说明表 抽取函数 函数说明 抽取函数示例 抽取前数据示例 抽取后数据示例 trim(字段) 裁剪字段前后的空白字符 trim(${name})
射前后的相关字段。 基本概念 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。
交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示: 图2 信息抽取 {