检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
详细指导 购买知识图谱&选择图谱规格 在创建知识图谱之前,需要购买图谱并选择图谱规格。 购买知识图谱 智能一键构建图谱 只需提供源数据,无需其他配置,即可快速构建图谱。 智能一键构建图谱 普通配置构建图谱 通过配置数据源、配置图谱本体、配置信息抽取、配置知识映射、配置知识融合、配置
训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 上传至OBS 将用于训练模型的数据上传至OBS目录: 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。确保您使用的OBS目录与KG服务在同一区域,桶的存储类别为“标准存储”。
调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证通用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证 Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。
本体是某个领域中抽象概念的集合,能够描述某个范围内一切事物的共有特征以及事物间的关系。例如图1可称作一个本体。 实体 实体是知识图谱三元组的元素之一,指某种具体的事物。例如某一具体的电影(人物或关系),可称作实体。 关系 关系是知识图谱三元组的元素之一,指实体与实体之间的语义关系,比如张三是
据的详细操作请参见上传文件。 由于当前KG部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG在同一区域,桶的存储类别为“标准存储”。 父主题: 一般性问题
创建“Film”和“Person”之间的关系。 具体操作如下: 按住键盘a键,同时鼠标单击概念节点“Film”,拖拽出一条线,移动至目标概念“Person”。 或鼠标右键单击一个概念节点“Film”,选择“新建关系”,然后拖拽出一条线,移动至目标概念“Person”。 右键单击关系曲线,选择“编辑”。 右侧弹出关系编辑框。
也可删除当前概念节点。 图5 删除概念 新建关系 按住键盘a键,同时鼠标单击一个概念并拖拽出一条线,移动至目标概念即可在两个概念之间新建关系。 也可鼠标右键单击一个概念节点,选择“新建关系”,然后拖拽出一条线,移动至目标概念即可在两个概念之间新建关系。 图6 新建关系 编辑关系 右键单击关系曲线,选择“编辑”。
"id":"a000111" "000111" split(字段, string pattern) 将字段值以pattern为分隔符分割,得到一个列表。pattern可以是一个正则表达式,所有与pattern匹配的子串都作为分隔符。 split(${roles}, ', ') "roles":"role1
信息抽取,您需要在创建知识图谱之前,创建信息抽取模型。 本章节提供一个与人物、电影有关的非结构化数据构建信息抽取模型流程,帮助您快速熟悉知识图谱自定义信息抽取模型创建过程,通过在控制台进行数据标注、模型训练,构建一个人物、电影有关的信息抽取模型。本样例以在ModelArts控制台
什么是知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
验证数据:20%数据用于验证信息抽取模型性能(即F1、P、R性能指标)。 训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。 三元组类型 本样例
配置知识融合时,如何选择融合标识符和配置属性 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
在图谱版本列表中单击操作栏的“更多 > 导出”。 图1 导出图谱 在图谱导出对话框中,选择导出的“OBS桶”和“存储路径”。所选的OBS桶需保证与KG服务在同一区域,桶的存储类别为“标准存储”。 图2 选择存储路径 单击“确定”。 等待图谱导出完成,在更新日志页签中,单击“查看导出结果”自动跳转至导出的OBS桶。
如图1所示。 图1 构建知识图谱 知识图谱的基本概念和创建图谱的流程概念请参见产品介绍>基本知识。 步骤一:购买知识图谱 在创建图谱之前,您需要购买图谱,并选择图谱规格,创建一个初始化的图谱。 步骤二:准备工作 准备图谱数据 在创建知识图谱时,需要提前将创建图谱的数据上传至OBS。
标注数据OBS文件路径不存在或没有权限,指定类型(dataset, brat, modelarts)标注数据的文件名有规定,请检查OBS文件名是否与规定一致,以及是否授权图谱平台读取所在OBS路径。 File type 'XXX' should exist in OBS directory s3://XXX
的函数字段。 例如以一个有关于电影的图谱数据为例,选择数据格式和数据源文件后,下方可预览基础数据。 图3 数据源配置 填写完信息后,单击“保存”。 如果您待创建的图谱只需要一个数据源,那么您已完成数据源的配置。 如果您待创建的图谱需要输入多个数据源,请进入下一步。 单击“数据源”
"id":"a000111" "000111" split(字段,string pattern ) 将字段值以pattern为分隔符分割,得到一个列表。pattern可以是一个正则表达式,所有与pattern匹配的子串都作为分隔符。 split(${roles}, ', ') "roles":"role1
体将保存至“我的库”。 图1 图谱本体 图谱本体配置完成后,鼠标悬浮在图谱本体方框区域,显示清空图标,单击后可一键清空图谱本体配置。 后续操作 选择图谱本体后,进入下一步操作配置信息抽取。
否 String 具有一跳关系的实体类型。默认为空,即查询有一跳关系的所有类型的实体。 说明: N跳关系说明:如果从一个实体A出发,经过N条关系(不论方向),能够到达实体B,则实体A、B之间是N跳关系。 特别地,如果两个实体之间是一跳关系,说明两个实体之间通过一条关系直接相连。 limit
property_name 否 String 属性名称。 property_value 否 Array of strings 属性值,目前只支持设置一个属性值。 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 count Integer 当前返回的实体结果个数。 results