检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
们将这些三元组类型组成的集合称为模型的schema。 标注数据 为了训练自定义的信息抽取模型,需要在训练数据中标注三元组类型。 您可以选择使用BRAT、MODELARTS或其他标注手段进行标注。 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。
low! 处理方法:合法的标注数据数量太少,模型无法训练,请标注更多数据。 错误信息:Train model error, check the parameters please! 处理方法:多种可能原因导致此错误,可能的原因如下: 1. 参数设置失衡导致模型训练失败,请减小max_len或者减小batch_size。
已发布版本的模型所选择的预置模板。 模型评估 已发布版本的模型评估参数。 准确率:在被所有预测为正的样本中实际为正样本的概率。 召回率:在实际为正的样本中被预测为正样本的概率。 F1:综合考虑准确率和召回率的影响,由两者计算而来,越接近1代表模型越好。 训练数据路径 已发布版本的模型,其训练数据的OBS存储目录。
根据自身业务需要,您可以删除模型版本。处于“训练完成”、“训练失败”、“版本创建失败”和“停用”状态的模型版本才能进行删除操作,版本状态请参见查看模型。 操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。
本中抽取三元组的模型,因此仅适用于抽取基础数据格式为txt文本的自然语言短句。 自定义模型流程 自定义信息抽取模型的流程如表1所示。 表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据 提前准备用于训练模型的数据。 准备训练数据 创建模型 基于您的训练数据(即已标注
训练数据:80%数据用于训练信息抽取模型。 验证数据:20%数据用于验证信息抽取模型性能(即F1、P、R性能指标)。 训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。
创建抽取模型后,针对处于“训练完成”和“停用”状态的模型版本,您可以根据自身业务需要,对模型版本进行修改优化。版本状态请参见查看模型。 操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击“模型名称”,进入模型详情页。
知识图谱提供一站式知识图谱全生命周期管理服务,用户无需关注底层实现细节,通过专门设计的知识图谱构建流水线,可以可视化构建本体、自动化构建知识图谱,并且随时对图谱进行全量、增量更新,保证知识的可靠、时效性。 管理本体 本体简介 创建本体 管理模型 准备训练数据 创建模型 创建版本 发布版本 创建图谱 智能一键构建图谱
自定义信息抽取模型 信息抽取模型简介 准备训练数据 创建模型 管理版本
发布版本 创建模型版本后,您需要通过发布操作,发布模型版本后,才能使对应的版本模型在创建知识图谱时用于信息抽取。 前提条件 已创建模型,并针对已创建的模型创建版本。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。
创建抽取模型后,您需要创建模型的版本,才能进行后续的发布操作,使模型在创建知识图谱时用于信息抽取。 每个模型最多可创建5个模型版本。 前提条件 在KG服务管理控制台创建抽取模型,详情请见创建模型。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。
使用自定义抽取模型创建图谱 本章节以有关于人物和电影的非结构化数据为例,提供一个使用自定义的信息抽取模型创建知识图谱的流程,帮助您快速熟悉使用非结构化数据和自定义信息抽取模型创建图谱的过程。 首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。然后在控制台上创建信息抽取模型和知识图谱,步骤如下:
管理版本 创建新版本 发布版本 修改版本 删除版本 父主题: 自定义信息抽取模型
用于自身业务的知识图谱。构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取
deleteModelVersion 更新模型版本 modelVersion updateModelVersion 重新训练模型版本 modelVersion retrainModelVersion 发布模型版本 modelVersion releaseModelVersion 停用模型版本 modelVersion
数据划分 训练数据:80%数据用于训练信息抽取模型。 验证数据:20%数据用于验证信息抽取模型性能(即F1、P、R性能指标)。 训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,
本文介绍了知识图谱 KG各特性版本的功能发布和对应的文档动态,欢迎体验。 2022年01月 序号 功能名称 功能描述 阶段 相关文档 1 知识图谱KG 2.0版本上线 知识图谱服务上线2.0版本: 全新的产品界面风格。 上线“我的图谱资产库”,整合本体、模型管理入口。 普通配置构建流水线全新升级,界面操作更易用。
单击,可以查看与该实体有关系的局部图谱数据。 单击,可以查看力引导布局的图谱。 单击,可以查看圆形布局的图谱。 单击,可以查看网格布局的图谱。 单击,可以查看分层布局的图谱。 单击,可以查看自动分群布局的图谱。 单击,可以下载当前图谱画面。 预览图谱 在图谱预览页面,您可以查看到所搜索的实体信息。
生命周期管理服务,包括本体可视化构建、自动化图谱流水线构建,以及图谱问答、搜索、推理等图谱应用能力,企业可以灵活掌控图谱配置,适合复杂多变的业务场景。
我的图谱用户资源提示已冻结怎么办? 问题描述 “知识图谱控制台>我的图谱”页面,图谱的运行状态为“已冻结”。 解决方案 图谱规格为体验版图谱 由于当前知识图谱服务仅支持在控制台创建一次体验版图谱,即创建一次体验版图谱后,无法第二次创建体验版图谱。需要确认体验版图谱是否到期冻结。