检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关的非结构化数据自定义信息抽取模型并使用自定义抽取模型创建知识图谱的流程,帮助您快速熟悉知识图谱自定义信息抽取模型创建过程和
知识图谱服务提供了REST(Representational State Transfer)风格API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。 父主题: 使用前必读
息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以创建一个有关于电影的知识图谱为例,抽取信息前后的实体信息如图2所示,展示如何在创建图谱时配置信息抽取。 图2 信息抽取 按配置数据源为待创建的图谱配置数据源。 按配置图谱本体为待创建的图谱选择本体。
使用自定义抽取模型创建图谱 本章节以有关于人物和电影的非结构化数据为例,提供一个使用自定义的信息抽取模型创建知识图谱的流程,帮助您快速熟悉使用非结构化数据和自定义信息抽取模型创建图谱的过程。 首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。然后在控制台上创建信息抽取模型和知识图谱,步骤如下:
实体电影的知识映射关系 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图3所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图3 知识融合示例 图谱质检 图
普通配置构建图谱流程 在KG服务上构建知识图谱的基本流程可归纳为如下步骤,创建流程如图1所示。 图1 构建知识图谱 知识图谱的基本概念和创建图谱的流程概念请参见产品介绍>基本知识。 步骤一:购买知识图谱 在创建图谱之前,您需要购买图谱,并选择图谱规格,创建一个初始化的图谱。 步骤二:准备工作
一般性问题 KG与其他服务的关系 什么是知识图谱服务 如何上传基础数据至OBS 提交知识图谱服务相关工单时,如何选择问题所属的产品类型 创建知识图谱时,为何提示“角色权限校验失败” 模型训练的常见报错提示及处理方法 我的图谱用户资源提示已冻结怎么办?
什么是知识图谱服务 知识图谱服务(Knowledge Graph,简称KG)提供一站式知识图谱全生命周期管理服务,包括本体可视化构建、自动化图谱流水线构建,以及图谱问答、搜索、推理等图谱应用能力,企业可以灵活掌控图谱配置,适合复杂多变的业务场景。 功能介绍 针对云服务没有构建知识
以不同布局方式查看图谱和实体。 :保存图谱或实体图片至本地。如果下载的界面字体太小,请滚动鼠标调整字体大小。 新建 “预览图谱”页面左上角可在当前图谱基础上,新建实体或实体间的关系,详情请见新建实体/关系。 运行记录和查询结果 “预览图谱”页面下方“运行记录”页签可查看在预览图谱页面的查询记录,
单击“保存”,完成知识映射。 如果创建多个数据源,请完成所有数据源的知识映射配置。配置数据源请参见配置数据源。 示例 以创建一个有关于电影的知识图谱为例,展示如何在创建图谱时配置知识映射。 按配置数据源为待创建的图谱配置数据源。 按配置图谱本体为待创建的图谱选择本体。 按配置信息抽取>示例为待创建的图谱配置信息抽取。
查看本体:查看图谱的本体信息结构。 修改本体:可基于已有图谱,修改本体的信息结构,详细操作请见查看/修改本体。 基于已有图谱修改本体,是指在已有本体基础上新建一个新的本体。 基于已有图谱修改本体,不能修改已有属性的类型。 更新日志 可查看日志更新列表,包括“运行编号”、“事件类型”、“本体”、“状
"id":"a000111" "000111" split(字段, string pattern) 将字段值以pattern为分隔符分割,得到一个列表。pattern可以是一个正则表达式,所有与pattern匹配的子串都作为分隔符。 split(${roles}, ', ') "roles":"role1
"id":"a000111" "000111" split(字段,string pattern ) 将字段值以pattern为分隔符分割,得到一个列表。pattern可以是一个正则表达式,所有与pattern匹配的子串都作为分隔符。 split(${roles}, ', ') "roles":"role1
沈振导演的电影的主演是谁 上一个实体 的 xx属性 它的上映日期 上一个实体 的 xx关系(正向) 他主演的电影 上一个实体 的 xx关系 的 xx关系(正向二跳关系) 她导演的电影的主演 上一个实体 和 xx实体 的关系 它和月光宝盒的关系 上一个实体 的 xx关系 的 xx属性(正向一跳关系的属性)
选中概念图标,使用快捷键“delete”也可删除当前概念节点。 图4 删除概念 新建关系 按住键盘a键,同时鼠标单击一个概念并拖拽出一条线,移动至目标概念即可在两个概念之间新建关系。 也可鼠标右键单击一个概念节点,选择“新建关系”,然后拖拽出一条线,移动至目标概念即可在两个概念之间新建关系。 图5 新建关系
标注数据 为了训练自定义的信息抽取模型,需要在训练数据中标注三元组类型。 您可以选择使用BRAT、MODELARTS或其他标注手段进行标注。 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 上传至OBS 将用于训练模型的数据上传至OBS目录:
选中概念图标,使用快捷键“delete”也可删除当前概念节点。 图5 删除概念 新建关系 按住键盘a键,同时鼠标单击一个概念并拖拽出一条线,移动至目标概念即可在两个概念之间新建关系。 也可鼠标右键单击一个概念节点,选择“新建关系”,然后拖拽出一条线,移动至目标概念即可在两个概念之间新建关系。 图6 新建关系
单击“创建”,填写如下配置信息,然后单击右下角的“保存”。 配置基本信息 配置元素链接(交互) 配置元素链接(代码编辑) 配置基本信息 选择元素,即在当前图谱中选择一个“概念名称”,并填写“配置描述”。后续元素链接配置均是对所选择的概念及其概念属性、概念间的关系进行链接配置。 图2 配置基本信息 配置元素链接(交互)
型字段”文本框中填写基础数据中描述实体类型的函数字段。 例如以一个有关于电影的图谱数据为例,选择数据格式和数据源文件后,下方可预览基础数据。 图3 数据源配置 填写完信息后,单击“保存”。 如果您待创建的图谱只需要一个数据源,那么您已完成数据源的配置。 如果您待创建的图谱需要输入多个数据源,请进入下一步。
多变的业务场景。 知识图谱在语义搜索与推荐、智能问答系统、大数据分析与决策等场景下均有广泛应用,具体请参见产品介绍>适用场景。 本文档介绍如何在知识图谱管理控制台快速构建知识图谱,并管理本体和知识图谱任务。 功能介绍 针对云服务没有构建知识图谱的现状,华为云为各类企业提供知识图谱