检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
的ID,获取方法请参见获取项目ID。 scope参数定义了Token的作用域,上面示例中获取的Token仅能访问project下的资源。您还可以设置Token作用域为某个账号下所有资源或账号的某个project下的资源,详细定义请参见获取用户Token。 POST https://iam
配置知识融合时,如何选择融合标识符和配置属性 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
果是否符合预期。 背景介绍 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 配置知识融合
您可以选择已在控制台创建的本体,或者选择从OBS导入的本体,用于组织待创建图谱的信息结构。 配置图谱本体 配置信息抽取 自定义抽取模型(可选) 如果您在创建知识图谱时,选择使用自定义模型进行信息抽取,您需要在创建知识图谱之前,自定义抽取模型。 创建模型 创建新版本 发布版本 配置信息抽取项 信息抽取是从基础数据中抽取
"id":"a000111" "000111" split(字段,string pattern ) 将字段值以pattern为分隔符分割,得到一个列表。pattern可以是一个正则表达式,所有与pattern匹配的子串都作为分隔符。 split(${roles}, ', ') "roles":"role1
"id":"a000111" "000111" split(字段, string pattern) 将字段值以pattern为分隔符分割,得到一个列表。pattern可以是一个正则表达式,所有与pattern匹配的子串都作为分隔符。 split(${roles}, ', ') "roles":"role1
xlsx格式,文件中每一个工作簿为一类数据,工作簿名为数据类型名。每个工作簿中,第一行为数据头,从第二行开始,每一行为一条数据。XLSX文件模板示例请单击下载。 CSV文件 该类型为结构化数据输入格式。使用CSV文件作为数据源时,首先需要把CSV文件上传至OBS的一个文件夹,构建图谱时,会读取该文件夹下所有以
AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证 Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Tok
XLSX、CSV、JSON格式的数据属于结构化数据。 本章节提供一个与电影有关的结构化数据样例,帮助您快速熟悉知识图谱的创建过程。此样例通过在控制台创建本体,完成信息抽取、信息映射、信息融合、图谱质检的配置,创建一个与电影有关的知识图谱。创建完成后,您可以搜索预览相关实体的知识图
右上角报错“OBS对象不存在”。 解决方法 报错原因一般是OBS桶或OBS对象加密,请检查OBS桶或OBS是否加密。 如果加密,请重新建一个不加密的OBS桶,即不要勾选“开启默认加密”。创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。 上传对象时不要勾选加密,OBS上传数据的详细操作请参见上传文件。
非结构化数据创建图谱 创建图谱简介 创建信息抽取模型 使用自定义抽取模型创建图谱
OBS导入本体 通过OBS导入一个新的本体。 前提条件 将待导入的本体文件(json格式)上传至OBS中,详情请参见OBS添加桶和OBS上传文件或文件夹。 从OBS导入 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在“本体管
型字段”文本框中填写基础数据中描述实体类型的函数字段。 例如以一个有关于电影的图谱数据为例,选择数据格式和数据源文件后,下方可预览基础数据。 图3 数据源配置 填写完信息后,单击“保存”。 如果您待创建的图谱只需要一个数据源,那么您已完成数据源的配置。 如果您待创建的图谱需要输入多个数据源,请进入下一步。
体信息,新建一个新的本体。 此操作和编辑本体存在区别。编辑本体是在已有本体基础上修改本体信息,新的本体信息会覆盖原有本体信息。而本章节所介绍的修改本体操作是基于某一个图谱版本使用的本体来修改本体信息,快速新建一个新的本体;同时会基于新的本体和当前图谱版本的数据生成一个新的图谱版本。
验证数据:20%数据用于验证信息抽取模型性能(即F1、P、R性能指标)。 训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。 三元组类型 本样例
参数类型 描述 label 否 String 具有一跳关系的实体类型。默认为空,即查询有一跳关系的所有类型的实体。 说明: N跳关系说明:如果从一个实体A出发,经过N条关系(不论方向),能够到达实体B,则实体A、B之间是N跳关系。 特别地,如果两个实体之间是一跳关系,说明两个实体之间通过一条关系直接相连。
沈振导演的电影的主演是谁 上一个实体 的 xx属性 它的上映日期 上一个实体 的 xx关系(正向) 他主演的电影 上一个实体 的 xx关系 的 xx关系(正向二跳关系) 她导演的电影的主演 上一个实体 和 xx实体 的关系 它和月光宝盒的关系 上一个实体 的 xx关系 的 xx属性(正向一跳关系的属性)
或其他要求。 可用区 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置
选中概念图标,使用快捷键“delete”也可删除当前概念节点。 图5 删除概念 新建关系 按住键盘a键,同时鼠标单击一个概念并拖拽出一条线,移动至目标概念即可在两个概念之间新建关系。 也可鼠标右键单击一个概念节点,选择“新建关系”,然后拖拽出一条线,移动至目标概念即可在两个概念之间新建关系。 图6 新建关系
property_name 否 String 属性名称。 property_value 否 Array of strings 属性值,目前只支持设置一个属性值。 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 count Integer 当前返回的实体结果个数。 results