检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
填写完概念的属性后,单击“操作”列的,保存信息。 编辑属性 单击已有属性“操作”列的,可对属性的“名称”重新编辑,也可重新选择“单值/多值”、“类型”。 修改完属性后,单击“操作”列的,保存信息。 复制属性 单击已有属性“操作”列的,复制当前属性。 删除属性 单击已有属性“操作”列的,删除当前属性。 填完信息后,单击“保存”。
时,可单击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示: 图2 信息抽取
用于自身业务的知识图谱。构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取
用于自身业务的知识图谱。构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取
务后,后台会对当前版本的知识图谱的知识质量和流水线构建进行评估,并生成质检报告,详见查看质检报告。 步骤10:生成图谱 在图谱流水线页面,单击右上角“生成图谱”,完成图谱的创建。 图13 生成图谱 跳至新建图谱“test”的详情页,查看图谱的状态,当图谱的“状态”由“运行中”变为
支持增量数据,更新图谱。 支持图谱预览、图谱版本管理。 构建图谱流程 KG服务为用户提供了两种方式构建图谱,不同的方式所需要的功能不同。基于不同的图谱构建方式,梳理了使用KG服务的主要流程。 图2 构建图谱流程 表2 构建图谱流程说明 主任务 说明 详细指导 购买知识图谱&选择图谱规格
配置元素链接 元素链接简介 创建元素链接 导入/导出元素链接 测试元素链接 发布元素链接 查看元素链接配置 编辑元素链接配置 删除/批量删除元素链接 父主题: 知识图谱问答KBQA服务
配置问答模板 创建问答模板 导入/导出问答模板 测试问答模板 发布问答模板 查看问答模板配置 编辑问答模板配置 删除/批量删除问答模板 父主题: 知识图谱问答KBQA服务
信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。 通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取的配置。 配置信息抽取 配置知识映射 - 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系。 通过设置映射前后的相关字段,完成知识映射的信息配置。 配置知识映射
说明 数据类别 基础数据中描述实体类型的字段。 抽取项名称 抽取信息后的属性字段。 抽取函数 抽取信息时所使用的引用字段的信息抽取函数,具体请见信息抽取函数。 确认所填写的信息后,单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图12 图谱本体 步骤6:配置信息抽取 以两条数据为例,抽取信息前后的实体信息如图13所示,展示如何配置信息抽取。
选择左侧“我的库”页签,在“图谱本体组件”中拖拽步骤1:创建本体中创建的本体“person_film”到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进
侧导航栏选择“资源包(原我的套餐包)”,可查看已购买的知识图谱套餐包。 选择图谱规格 登录KG服务管理控制台,默认进入“我的图谱”页面。 单击,在创建图谱页面按表2填写信息。 图1 服务选型 表2 服务选型参数说明 参数 说明 “图谱名称” 待创建图谱的名称,名称只能由大小写字母
侧导航栏选择“资源包(原我的套餐包)”,可查看已购买的知识图谱套餐包。 选择图谱规格 登录KG服务管理控制台,默认进入“我的图谱”页面。 单击,在创建图谱页面按表2填写信息。 图1 服务选型 表2 服务选型参数说明 参数 说明 “图谱名称” 待创建图谱的名称,名称只能由大小写字母
训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。 三元组类型 本样例构建的模型适用于人物、电影领域的信息抽取,限定抽取的三元组类型如表1所示。