检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么是字段抽取函数 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在通过普通抽取方式进行信息抽取时,即用交互界面配置或用格式化编辑进行信息抽取时,需要配置字段抽取函数。配置
配置元素链接 元素链接简介 创建元素链接 导入/导出元素链接 测试元素链接 发布元素链接 查看元素链接配置 编辑元素链接配置 删除/批量删除元素链接 父主题: 知识图谱问答KBQA服务
支持创建知识图谱流水线任务,生成知识图谱。 支持编辑知识图谱流水线任务信息,包括数据源选择、图谱本体配置、信息抽取配置、知识映射信息配置、知识融合信息配置、图谱质检配置。 支持增量数据,更新图谱。 支持图谱预览、图谱版本管理。 创建图谱流程 智能一键构建图谱 只需提供源数据,无需其他配置,即可快速构建图谱。详细操作步骤请见一键智能构建图谱。
支持创建知识图谱流水线任务,生成知识图谱。 支持编辑知识图谱流水线任务信息,包括数据源选择、图谱本体配置、信息抽取配置、知识映射信息配置、知识融合信息配置、图谱质检配置。 支持增量数据,更新图谱。 支持图谱预览、图谱版本管理。 创建图谱流程 智能一键构建图谱 只需提供源数据,无需其他配置,即可快速构建图谱。详细操作步骤请见一键智能构建图谱。
什么是信息抽取 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围
知识图谱的计费规格,一万条边、百万边、千万边具体指什么 知识图谱的数据存储在图数据库,图数据库基本数据类型包含点和边。 点代表实体。如交通网络中的车辆、通信网络中的站点、电商交易网络中的用户和商品、互联网中的网页等。 边代表关系。如社交网络中的好友关系、电商交易网络中用户评分和购
API概览 KG服务提供接口请参见表1,您可以使用知识图谱数据面管理功能。 表1 知识图谱数据面接口 API 说明 执行知识图谱查询命令 根据图谱ID执行知识图谱查询命令。 查询实体详情 根据图谱ID和实体ID查询实体详情,包括实体的ID、类型、属性及属性值。 过滤查询实体列表
OBS导入本体 确认信息后,单击“确定”,跳转至“本体管理”页面。 您可以查看从OBS导入的本体,并通过“操作”栏的操作预览本体、编辑本体、导出本体、删除本体。 父主题: 创建本体
”。 单击“保存”,完成知识映射。 如果创建多个数据源,请完成所有数据源的知识映射配置。配置数据源请参见配置数据源。 示例 以创建一个有关于电影的知识图谱为例,展示如何在创建图谱时配置知识映射。 按配置数据源为待创建的图谱配置数据源。 按配置图谱本体为待创建的图谱选择本体。 按配
please! 处理方法:标注数据所在OBS路径无读取下载权限,请检查是否授权图谱服务读取标注数据所在OBS路径。 KG-RE.1050 错误信息:Annotation data is too low! 处理方法:合法的标注数据数量太少,模型无法训练,请标注更多数据。 错误信息:Train
针对已经创建的知识图谱,您可以增量更新图谱,即在原有图谱的数据基础上增加新的数据更新知识图谱。 增量更新图谱 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片。 进入图谱详情页面。 单击右上角的“增量更新”。 进入“增量更新”页面,通过配置数据源、配置信息抽取、配置知识映射
针对已经创建的知识图谱,您可以增量更新图谱,即在原有图谱的数据基础上增加新的数据更新知识图谱。 增量更新图谱 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片。 进入图谱详情页面。 单击右上角的“增量更新”。 进入“增量更新”页面,通过配置数据源、配置信息抽取、配置知识映射
updateKgVersionInfo 创建本体 ontology createOntology 删除本体 ontology deleteOntology 导出本体 ontology exportOntology 导入本体 ontology importOntology 更新本体 ontology
步骤4:配置数据源 在流水线构建页面,单击“数据源”,页面下方弹出数据源配置对话框,单击右侧按钮可以放大对话框。 图5 配置数据源 在“数据源配置”对话框,填写相关信息。 “选择数据格式”:此样例选择“短文本”。 “选择数据源文件”:单击,弹出“选择数据源文件”对话框,选择数据源存放在OBS的路径:
什么是知识映射 建立从基础数据中抽取的结构化信息与所创建的知识图谱中的实体、属性、实体间相互关系的映射关系。 父主题: 创建图谱
标注结果导出至OBS。在发布数据集时,“版本格式”选择“Default”。 ModelArts发布的标注数据集是“.manifest”格式的文件,其中包含多行,每行是一个JSON格式的标注样例。 前提条件 准备训练数据并上传至OBS目录,详细步骤请参见准备训练数据,数据类型和要求请见训练数据类型介绍。
引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。 表1 信息抽取函数说明表 抽取函数 函数说明 抽取函数示例 抽取前数据示例 抽取后数据示例 trim(字段) 裁剪字段前后的空白字符 trim(${name})
知识映射配置。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 已完成信息抽取配置,详情请参见配置信息抽取。 操作步骤 在普通配置构建图谱页面,单击“知识映射”,页面下方弹出“知识映射”对话框,单击右侧按钮可以放大对话框。
射前后的相关字段。 基本概念 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。
交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示: 图2 信息抽取 {