检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在创建抽取模型时,需要您提前准备用于训练模型的数据并上传至OBS目录,数据格式为txt文本的自然语言短句。KG服务当前支持的数据类型请参见训练数据类型介绍。 准备数据流程如下: 准备待标注的数据 定义三元组类型(schema) 标注数据 上传至OBS 准备待标注的数据 准备待标注的训练数据,并保存至本地
如何创建知识图谱 构建图谱流程 KG服务为用户提供了两种方式构建图谱,不同的方式所需要的功能不同。基于不同的图谱构建方式,梳理了使用KG服务的主要流程。 图1 构建图谱流程 表1 构建图谱流程说明 主任务 说明 详细指导 购买知识图谱&选择图谱规格 在创建知识图谱之前,需要购买图谱并选择图谱规格。
单击,可以查看与该实体有关系的局部图谱数据。 单击,可以查看力引导布局的图谱。 单击,可以查看圆形布局的图谱。 单击,可以查看网格布局的图谱。 单击,可以查看分层布局的图谱。 单击,可以查看自动分群布局的图谱。 单击,可以下载当前图谱画面。 预览图谱 在图谱预览页面,您可以查看到所搜索的实体信息。
针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。 当图谱版本数量达到上限时,无法全量更新图谱。 前提条件 在全量更新知识图谱之前,如果您选择通过流水线配置构建新图谱,您需要提前创建用于组织新图谱信息结构的本体,方式如下: 方式一:控制台创建本体 方式二:OBS导入本体
针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。 当图谱版本数量达到上限时,无法全量更新图谱。 前提条件 在全量更新知识图谱之前,如果您选择通过流水线配置构建新图谱,您需要提前创建用于组织新图谱信息结构的本体,方式如下: 方式一:控制台创建本体 方式二:OBS导入本体
in ["dataset", "brat", "modelarts"]! 平台支持三种类型的标注数据(dataset, brat, modelarts),请将文件格式转化为平台所规定的文件格式,并选择对应的标注数据类型。 Parameter {A} cannot be null! 参
如何创建本体 创建本体方式 方式一:控制台创建本体 方式二:OBS导入本体 父主题: 管理本体
实体的知识图谱。 选择“模糊匹配”,输入实体名称部分字段,按回车进入图谱预览页面,预览实体名称含该字段的所有实体的知识图谱。 举例:输入实体名称“任霞”,按回车进入图谱预览页面,预览实体“任霞”的知识图谱。 单击右侧功能区域的图标,可查看图谱中的整个实体关系。 父主题: 管理图谱
如何访问知识图谱 知识图谱服务提供了Web化的服务管理平台,即管理控制台和基于HTTPS请求的API(Application programming interface)管理方式。 管理控制台方式 KG服务提供了简洁易用的管理控制台,包含配置数据源、图谱本体、信息抽取、知识映射、
结构化抽取适用于xlsx、csv、json格式的基础数据,选择结构化抽取方式信息抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取
ody中auth.scope的取值需要选择project,如下所示。 获取用户Token接口请求构造如下,您可以从接口的请求部分看到所需的请求参数及参数说明。获取Token消息头只需填写“Content-Type”。将消息体加入后的请求如下所示,加粗的斜体字段需要根据实际值填写,
信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围 具体方式 操作指引 结构化抽取
配置完流水线的图谱,如何修改数据 已通过流水线配置完成构建的知识图谱,如果想要修改数据,可通过全量更新或增量更新图谱的方式,更新图谱。 全量更新图谱 针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。 增量更新图谱 针对已经创建的知识图谱,您可以增量更新图
说明 数据类别 基础数据中描述实体类型的字段。 抽取项名称 抽取信息后的属性字段。 抽取函数 抽取信息时所使用的引用字段的信息抽取函数,具体请见信息抽取函数。 确认所填写的信息后,单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
已完成数据源配置,详情请参见配置数据源。 熟悉KG服务支持的信息抽取函数。 操作步骤 在普通配置构建图谱页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 在“信息抽取”对话框中,“抽取方式”选择“结构化抽取”,“编辑方式”选择“代码编辑”。 图1 信息抽取 选择“默认抽取”开关。
为何知识图谱无法运行,提示“错误的信息抽取函数” 问题描述 知识图谱无法运行,提示“错误的信息抽取函数”。 可能原因 流水线信息抽取配置有误。 解决方案 检查信息抽取函数和配置信息抽取时所填的参数。 知识图谱服务支持的信息抽取函数具体请参见信息抽取函数。配置信息抽取操作请参见配置信息抽取。
训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。 三元组类型 本样例构建的模型适用于人物、电影领域的信息抽取,限定抽取的三元组类型如表1所示。
填写完概念的属性后,单击“操作”列的,保存信息。 编辑属性 单击已有属性“操作”列的,可对属性的“名称”重新编辑,也可重新选择“单值/多值”、“类型”。 修改完属性后,单击“操作”列的,保存信息。 复制属性 单击已有属性“操作”列的,复制当前属性。 删除属性 单击已有属性“操作”列的,删除当前属性。 填完信息后,单击“保存”。
信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围 具体方式 操作指引 结构化抽取 基础数据格式为xlsx、csv、json格式 交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。
信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在通过普通抽取方式进行信息抽取时,即用交互界面配置或用格式化编辑进行信息抽取时,需要配置字段抽取函数。配置字段抽取函数后,KG服务会根据所配置的字段抽取函数进