检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
针对已经创建的知识图谱,您可以增量更新图谱,即在原有图谱的数据基础上增加新的数据更新知识图谱。 增量更新图谱 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片。 进入图谱详情页面。 单击右上角的“增量更新”。 进入“增量更新”页面,通过配置数据源、配置信息抽取、配置知识映射
在版本管理列表中的“操作”栏,单击“修改”,弹出“修改版本”对话框。 图1 修改版本 在“修改版本”对话框中,填写“模型参数”的参数值和“描述”,如图2所示,鼠标移至可查看参数含义和推荐值。 图2 修改版本 单击“确定”,完成模型版本的修改。 父主题: 管理版本
”。 单击“保存”,完成知识映射。 如果创建多个数据源,请完成所有数据源的知识映射配置。配置数据源请参见配置数据源。 示例 以创建一个有关于电影的知识图谱为例,展示如何在创建图谱时配置知识映射。 按配置数据源为待创建的图谱配置数据源。 按配置图谱本体为待创建的图谱选择本体。 按配
待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。
什么是知识映射 建立从基础数据中抽取的结构化信息与所创建的知识图谱中的实体、属性、实体间相互关系的映射关系。 父主题: 创建图谱
待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。
知识映射配置。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 已完成信息抽取配置,详情请参见配置信息抽取。 操作步骤 在普通配置构建图谱页面,单击“知识映射”,页面下方弹出“知识映射”对话框,单击右侧按钮可以放大对话框。
引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。 表1 信息抽取函数说明表 抽取函数 函数说明 抽取函数示例 抽取前数据示例 抽取后数据示例 trim(字段) 裁剪字段前后的空白字符 trim(${name})
交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示: 图2 信息抽取 {
射前后的相关字段。 基本概念 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。
步骤4:配置数据源 在流水线构建页面,单击“数据源”,页面下方弹出数据源配置对话框,单击右侧按钮可以放大对话框。 图5 配置数据源 在“数据源配置”对话框,填写相关信息。 “选择数据格式”:此样例选择“短文本”。 “选择数据源文件”:单击,弹出“选择数据源文件”对话框,选择数据源存放在OBS的路径:
pe”,即可查看到可抽取的主语、谓语、宾语组合。 图2 抽取模型 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 后续操作 配置信息抽取后,进入创建图谱的下一步操作配置知识映射。 父主题: 配置信息抽取
此仅适用于抽取基础数据格式为txt文本的自然语言短句。 自定义模型流程 自定义信息抽取模型的流程如表1所示。 表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据 提前准备用于训练模型的数据。 准备训练数据 创建模型 基于您的训练数据(即已标注数据),您可以在KG服务中创建信息抽取模型。
基本概念 账号 用户注册华为云时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用他们进行日常管理工作。 用户 由账号在IAM中创建的用户,是云
填写完概念的属性后,单击“操作”列的,保存信息。 编辑属性 单击已有属性“操作”列的,可对属性的“名称”重新编辑,也可重新选择“单值/多值”、“类型”。 修改完属性后,单击“操作”列的,保存信息。 复制属性 单击已有属性“操作”列的,复制当前属性。 删除属性 单击已有属性“操作”列的,删除当前属性。 填完信息后,单击“保存”。
单击操作列的“编辑”,在元素配置页面编辑配置信息,参数说明请参见配置元素链接(交互)。 也可以用代码编辑元素配置信息,请见配置元素链接(代码编辑)。 不支持更改概念,仅支持编辑概念的元素链接配置和配置描述。 图1 编辑元素配置 编辑完成,单击“保存”。 父主题: 配置元素链接
见表1。 图3 创建流程图 表1 创建流程表 流程 方法 说明 详细指导 配置数据源 - 数据是知识图谱的基础。 基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。 配置数据源 配置图谱本体 - 您可以选择已在控制台创建的本体,或者选择从OBS导入的本体,用于组织待创建图谱的信息结构。
南》。 与对象存储服务的关系 知识图谱服务使用对象存储服务(Object Storage Service,简称OBS)存储构建知识图谱的源数据,实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务控制台指南》。 父主题: 一般性问题
构建本体、自动化构建知识图谱,并且随时对图谱进行全量、增量更新,保证知识的可靠、时效性。 管理本体 本体简介 创建本体 管理模型 准备训练数据 创建模型 创建版本 发布版本 创建图谱 智能一键构建图谱 普通配置构建图谱 准备图谱数据 配置数据源 配置图谱本体 配置信息抽取 配置知识映射
对于已经创建的图谱版本,支持导出图谱版本至OBS桶。导出的图谱可以通过“全量更新 > 图谱导入”进行恢复。 导出的图谱版本包含以下信息: csv文件夹:存放csv源数据文件 ontology.json:图谱本体配置文件 pipeline_config.json:流水线配置文件 操作步骤 登录KG服务管理控制台,默认进入“我的图谱”页面。