检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在创建信息抽取模型之前,您需要自行准备基础数据并上传至OBS桶及文件夹中。 由于数据安全原因,本样例不提供具体的样例数据,仅提供样例数据要求,要求如下: 数据格式 数据格式为短文本txt格式,文件内容示例如下: 张三的生日是1990年1月1日,身高175cm,出生于北京。 李四,著名导演,毕业于电影学院,代表作有《电影1》、《电影2》。
谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关的非结构化数据自定义信息抽取模型并使用自定义抽取模型创建知识
KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。 表1 信息抽取函数说明表 抽取函数 函数说明 抽取函数示例 抽取前数据示例 抽取后数据示例
代码配置模式 格式化编辑指通过编辑json格式代码,完成知识映射配置。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 已完成信息抽取配置,详情请参见配置信息抽取。 操作步骤 在普通配
参数设置失衡导致模型训练失败,请减小max_len或者减小batch_size。 2. 标注数据编码格式有误,请检查标注数据文件格式是否为UTF-8。 3. 标注数据格式有误,请检查标注数据所否为平台规定的格式一致。 如无法定位,请发工单联系运维人员查看日志解决。 KG-RE.1060 错误信息:Save
OBS导入本体 通过OBS导入一个新的本体。 前提条件 将待导入的本体文件(json格式)上传至OBS中,详情请参见OBS添加桶和OBS上传文件或文件夹。 从OBS导入 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在“本体管
KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。 表1 抽取函数说明表 抽取函数 函数说明 抽取函数示例 抽取前数据示例
本进行语义解析,识别出其中与图谱相关联的多种类型的元素。 上传元素配置文件到OBS 导入元素配置至知识图谱前,需要将元素配置文件(json格式)上传至OBS中,详情请参见OBS添加桶和OBS上传文件或文件夹。 导入元素配置至知识图谱 上传元素配置文件到OBS后,知识图谱控制台支持导入OBS中的元素配置文件。
在KG服务管理控制台上自定义信息抽取模型是一种基于schema约束的中文信息抽取模型,即从自然语言文本中抽取三元组的模型,因此仅适用于抽取基础数据格式为txt文本的自然语言短句。 自定义模型流程 自定义信息抽取模型的流程如表1所示。 表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据
侧按钮可以放大对话框。 图2 配置数据源 在数据源配置对话框,填写相关信息。 “选择数据格式”:构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”、“短文本”,详情请见数据格式要求。 “选择数据源文件”:单击,弹出“选择数据源文件”对话框,选择数据源存放在OBS的路径:
的错误码,请参见API网关错误码进行处理。 状态码 错误码 错误信息 描述 处理措施 400 KGP.0001 请求体格式非法。 请求体格式非法。 检查请求体格式。 400 KGP.0002 请求参数错误。 请求参数错误。 检查请求体参数。 400 KGP.0003 资源重名。 资源重名。
智能一键构建图谱 参数 说明 图谱名称 待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。
n。有了Token之后,您就可以使用Token认证调用其他API。 图1 获取用户Token响应消息头 响应消息体 响应消息体通常以结构化格式返回,与响应消息头中Content-type对应,传递除响应消息头之外的内容。 对于获取用户Token接口,返回如下消息体。为篇幅起见,这里只展示部分内容。
objects 该gremlin语句非常规格式的返回结果。 path Array of pathItem objects 路径查询结果,为组成该路径的一系列关系的集合。 表5 edges 参数 参数类型 描述 id String 关系ID,格式为“source(头实体ID)-targ
智能一键构建图谱 参数 说明 图谱名称 待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。
智能一键构建图谱 参数 说明 图谱名称 待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。
数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。 图标说明开关处于关闭状态,需要编辑json格式代码。 在“信息抽取”对话框下方编辑json格式代码。 在“代码编辑”页签编辑json代码配置信息抽取时,可单击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。
会立即显示“返回结果”,包括问题中的“链接词”、“位置”、“链接类型”、“链接分数”和“链接结果”。 单击操作列的“查看详情”,可查看json格式的结果。 图1 元素链接测试 父主题: 配置元素链接
实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。 代码配置模式:通过编辑json格式代码,完成知识映射配置。具体步骤请见代码配置模式。 进行知识映射时,表格配置模式、代码配置模式可以相互切换。 知识映射配置完成后,鼠标悬浮
求使用KG提供的一系列常用实践。 表1 常用最佳实践 实践 描述 结构化数据创建图谱 本实践指导使用结构化数据(XLSX、CSV、JSON格式的数据)创建图谱。以与电影有关的结构化数据为例,通过在控制台创建本体、完成信息抽取、知识映射、知识融合、图谱质检的配置,运行对应流水线任务