检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
公共响应参数 表1 公共响应消息头 名称 描述 Content-Length 响应消息体的字节长度,单位为Byte。 Date 系统响应的时间。 Content-type 发送的实体的MIME类型。 父主题: 数据结构
在知识图谱服务中,需要提前从OBS导入用于构建知识图谱的基础数据。 信息抽取 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在知识图谱服务中,需要通过输入实体类型、抽取函数及抽取前后的数据字段,或创建信息抽取模型来配置信息抽取。
公共请求参数 表1 公共请求消息头 名称 描述 是否必选 示例 Content-type 发送的实体的MIME类型。 是 application/json Content-Length 请求body长度,单位为Byte。 POST/PUT请求为可选, GET不包含 3495 X-Auth-Token
结构化抽取适用于xlsx、csv、json格式的基础数据,选择结构化抽取方式信息抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取
映射,设置抽取映射前后的相关字段。 基本概念 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。
选择左侧“我的库”页签,在“图谱本体组件”中拖拽合适的本体到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“本体管理”页面创建或OBS导入的所有本体。 “公有库”页签下的“图谱本体组件”呈现的是KG服务预置的本体,如果有满足您需求的本体,您也可以直接拖拽使用。
数据结构 公共响应参数 公共请求参数
可在下方查看从文本信息中抽取的知识类型,知识类型包括主语“Subject_type”、谓语“Predicate”、宾语“Object_type”,即可查看到可抽取的主语、谓语、宾语组合。 图2 抽取模型 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示: 图2 信息抽取 {
当购买知识图谱并选择图谱规格之后,可以根据自身的业务需求使用KG提供的一系列常用实践。 表1 常用最佳实践 实践 描述 结构化数据创建图谱 本实践指导使用结构化数据(XLSX、CSV、JSON格式的数据)创建图谱。以与电影有关的结构化数据为例,通过在控制台创建本体、完成信息抽取、知识映射、知识融合、图谱质检的配置,运
准确率:在被所有预测为正的样本中实际为正样本的概率。 召回率:在实际为正的样本中被预测为正样本的概率。 F1:综合考虑准确率和召回率的影响,由两者计算而来,越接近1代表模型越好。 训练数据路径 已发布版本的模型,其训练数据的OBS存储目录。 更新时间 已发布的模型版本的更新时间。 状态
KG与其他服务的关系 与统一身份认证服务的关系 知识图谱服务使用统一身份认证服务(Identity and Access Management,简称IAM)实现认证功能。IAM的更多信息请参见《统一身份认证服务用户指南》。 与对象存储服务的关系 知识图谱服务使用对象存储服务(Object
文本的自然语言短句。 自定义模型流程 自定义信息抽取模型的流程如表1所示。 表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据 提前准备用于训练模型的数据。 准备训练数据 创建模型 基于您的训练数据(即已标注数据),您可以在KG服务中创建信息抽取模型。 创建模型 创建新版本
图谱版本管理简介 针对已创建的知识图谱,您可以对不同版本的图谱进行管理,还可以对图谱进行发布、删除等操作。 查看图谱详情 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击待查看的图谱卡片,进入图谱详情页面,可查看如下信息。 在线版本图谱 图谱应用 版本统计 图1 图谱详情
登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。 在图谱版本列表中单击操作栏的“更多 > 导出”。 图1 导出图谱 在图谱导出对话框中,选择导出的“OBS桶”和“存储路径”。所选的OBS桶需保证与KG服务在同一区域,桶的存储类别为“标准存储”。
“存储路径”:选择数据源文件存放在OBS桶的文件路径。 说明: 数据源存储的OBS路径不允许使用加密的OBS路径。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。
“存储路径”:选择数据源文件存放在OBS桶的文件路径。 说明: 数据源存储的OBS路径不允许使用加密的OBS路径。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。
一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源
按照流水线依次进行配置,详细的操作指引请见表1。 图3 创建流程图 表1 创建流程表 流程 方法 说明 详细指导 配置数据源 - 数据是知识图谱的基础。 基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。 配置数据源 配置图谱本体 - 您可以选择已在控制台创建的本体,或者
处理方法:多种可能原因导致此错误,可能的原因如下: 1. 参数设置失衡导致模型训练失败,请减小max_len或者减小batch_size。 2. 标注数据编码格式有误,请检查标注数据文件格式是否为UTF-8。 3. 标注数据格式有误,请检查标注数据所否为平台规定的格式一致。 如无法定位,请发工单联系运维人员查看日志解决。