检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据集。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访问,请务必保证创建的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 参考上传文件,使用单个文件上传方式将本地准备的训练数据“annotation.txt”文件上传至OBS路径“kg-m
图。 编辑本体:创建本体后,编辑本体信息,更新本体。 导出本体:把创建的本体导出至OBS文件夹中。 删除本体:删除已创建的本体,以适应业务变化。 创建本体方式 方式一:控制台创建本体 方式二:OBS导入本体 父主题: 管理本体
数据集。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访问,请务必保证创建的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 参考上传文件,使用单个文件上传方式将本地准备的训练数据“annotation.txt”文件上传至OBS路径“kg-m
数据上传至OBS桶及文件夹。 登录OBS服务控制台,创建桶和文件夹,用于存放样例数据集,创建名称为“kg-test”的OBS桶,名称为“demo-data”的文件夹。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访问,请务必保证创建的OBS桶与KG服务
与对象存储服务的关系 知识图谱服务使用对象存储服务(Object Storage Service,简称OBS)存储构建知识图谱的源数据,实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务控制台指南》。
”、“BRAT”、“MODELARTS”,详情请见训练数据类型介绍。 OBS桶 选择训练数据存储的OBS桶。需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 文件夹 选择训练数据存储在OBS桶中的文件夹。 描述 模型的描述。 单击“确定”,完成模型创建。 跳至
在“用户”界面,单击“创建用户”。 在“创建用户”界面,输入“用户名”“邮箱”。 “访问方式”选择“华为云管理控制台访问”中的“首次登录时设置”。 “登录保护”选择“开启”,并选择身份验证方式,单击“下一步”。 在“所属用户组”的下拉框中,选择步骤2中创建的用户组,单击“下一步”。
“选择数据源文件”:单击,弹出“选择数据源文件”对话框,选择数据源存放在OBS的路径: “OBS桶”:选择数据源文件存放的OBS桶“kg-model”。确保您使用的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 “存储路径”:选择数据源文件存放在OBS桶的文件路径“kg-model/graph-data/corpus
说明 详细指导 配置数据源 - 数据是知识图谱的基础。 基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。 配置数据源 配置图谱本体 - 您可以选择已在控制台创建的本体,或者选择从OBS导入的本体,用于组织待创建图谱的信息结构。 配置图谱本体 配置信息抽取
谱质检配置。 支持增量数据,更新图谱。 支持图谱预览、图谱版本管理。 构建图谱流程 KG服务为用户提供了两种方式构建图谱,不同的方式所需要的功能不同。基于不同的图谱构建方式,梳理了使用KG服务的主要流程。 图2 构建图谱流程 表2 构建图谱流程说明 主任务 说明 详细指导 购买知识图谱&选择图谱规格
信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在通过普通抽取方式进行信息抽取时,即用交互界面配置或用格式化编辑进行信息抽取时,需要配置字段抽取函数。配置字段抽取函数后,KG服务会根据所配置的字段抽取函数
登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击已创建图谱的名称,进入图谱详情页面,包含信息如图1所示。 图1 图谱详情 单击“预览图谱”,选择匹配方式: 选择“完全匹配”,输入“实体名称”,按回车进入图谱预览页面,预览该实体的知识图谱。 选择“模糊匹配”,输入实体名称部分字段,按回车进入
操作步骤 在普通配置构建图谱页面,单击“知识映射”,页面下方弹出“知识映射”对话框,单击右侧按钮可以放大对话框。 图1 知识映射 “编辑方式”选择“代码配置模式”。 在“代码配置模式”页签的编辑框中,输入json格式代码,以映射关系如图2为例,代码示例如下所示: 图2 实体人物的映射关系
创建图谱简介 数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关
配置图谱本体 在创建知识图谱时,首先您需要把已创建的本体导入至待创建的图谱中,用于组织待创建图谱的信息结构。 前提条件 已创建本体,具体创建方式见创建本体。 已创建图谱并选择图谱规格,请参见购买知识图谱。 已配置数据源,请参见配置数据源。 操作步骤 在普通配置构建图谱页面,单击“图谱本体”。
图1 信息抽取 在“创建图谱”页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框。 在“信息抽取”对话框中,“抽取方式”选择“结构化抽取”,“编辑方式”选择“交互界面”。 关闭“默认抽取”开关。 在“信息抽取”对话框中填写信息抽取项,按表1填写。 表1 信息抽取项示例 数据类别
操作步骤 在普通配置构建图谱页面,单击“知识映射”,页面下方弹出“知识映射”对话框,单击右侧按钮可以放大对话框。 图1 知识映射 “编辑方式”选择“表格配置模式”,填写知识映射的相关信息。 配置实体的概念映射:在对应实体下方的“概念映射”区域填写映射前的实体类型字段。 配置实体
配置完流水线的图谱,如何修改数据 已通过流水线配置完成构建的知识图谱,如果想要修改数据,可通过全量更新或增量更新图谱的方式,更新图谱。 全量更新图谱 针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。 增量更新图谱 针对已经创建的知识图谱,您可以增量更新图
知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。 代码配置模式:通过编辑json格式代码,
在图谱流水线配置页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 图1 流水线配置页面 在“信息抽取”对话框中,“抽取方式”默认为“非结构化抽取”。 根据自身业务需要,您可以选择“公有库模型”、“预置模型”或者“用户自定义模型”,三者仅需选择一项。 “公有库模