检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
怎样配置实体唯一标识字段 实体唯一标识字段 实体唯一标识字段指能识别每个数据的唯一字段,该字段在所有数据中具有唯一性,能唯一代表所对应的数据,类似于数据的“身份证”。 例如如下数据的唯一标识字段为“url” ,因为该字段能唯一代表该数据,因此在配置实体唯一标识字段时,“唯一标识字段”的文本框中填写“url”。
字段抽取函数后,KG服务会根据所配置的字段抽取函数进行信息抽取,即从原始数据中抽取结构化的信息。更多详情请见配置信息抽取。 字段抽取函数说明 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础
需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。 表1 信息抽取函数说明表
设置抽取映射前后的相关字段。 基本概念 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。
“为OBS桶授权”:如果OBS桶未授权,请勾选“确认授权”。 选择完成后,单击“确定”。 “实体类型字段”:当数据格式选择“JSON”时,在“实体类型字段”文本框中填写基础数据中描述实体类型的函数字段。 例如以一个有关于电影的图谱数据为例,选择数据格式和数据源文件后,下方可预览基础数据。 图3
知识图谱的计费规格,一万条边、百万边、千万边具体指什么 知识图谱的数据存储在图数据库,图数据库基本数据类型包含点和边。 点代表实体。如交通网络中的车辆、通信网络中的站点、电商交易网络中的用户和商品、互联网中的网页等。 边代表关系。如社交网络中的好友关系、电商交易网络中用户评分和购买行为、论文
选择“完全匹配”,输入“实体名称”,按回车进入图谱预览页面,预览该实体的知识图谱。 选择“模糊匹配”,输入实体名称部分字段,按回车进入图谱预览页面,预览实体名称含该字段的所有实体的知识图谱。 举例:输入实体名称“任霞”,按回车进入图谱预览页面,预览实体“任霞”的知识图谱。 单击右侧功
在实体“人物”下方的“类型映射”区域填写映射前的实体类型字段“Person”。 填写映射到实体“人物”的抽取项,如表2所示。 图5 实体人物知识映射 表2 实体人物的知识映射字段 属性 抽取项 name 中文名 国籍 国籍 职业 职业 出生日期 出生日期 单击“保存”,完成配置知识映射。 后续操作 配置知识映
的“删除”,即可删除信息抽取项。 按表1填写“数据类别”,“抽取项名称”和“抽取函数”。 表1 信息抽取项属性说明 属性 说明 数据类别 基础数据中描述实体类型的字段。 抽取项名称 抽取信息后的属性字段。 抽取函数 抽取信息时所使用的引用字段的信息抽取函数,具体请见信息抽取函数。
信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围 具体方式 操作指引 结构化抽取 基础数据格式为xlsx、csv、json格式 交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。
填写实体“电影”的属性配置项信息。 可添加多组属性配置项,每组属性配置项可添加多个判断融合的属性配置。至少存在一组属性配置项,组内所有判断融合的属性相似度均大于相似度阈值时,即可融合这两条数据。 本样例只需添加一个属性配置分组,一组里填写两个属性配置项信息,如图17所示。 单击“添加分组”,即可添加一组新的属性配置项。
填写实体“电影”的属性配置项信息。 可添加多组属性配置项,每组属性配置项可添加多个判断融合的属性配置。至少存在一组属性配置项,组内所有判断融合的属性相似度均大于相似度阈值时,即可融合这两条数据。 本样例只需添加一个属性配置分组,一组里填写两个属性配置项信息,如图17所示。 单击“添加分组”,即可添加一组新的属性配置项。
myhuaweicloud.com/v3/auth/tokens 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 如下公共消息头需要添加到请求中。 Content-Type:消息体的类型(格式),必选,默
配置问答模板(交互) 模板元素模板序列 添加问答模板包含的元素。 单击“添加元素”,在对话框中选择问答模板所包含的“元素类型”,例如“概念”,输入“概念名”。可添加多个元素,元素类型请见表1。 图3 添加元素 表1 添加元素 元素类型 字段说明 概念 配置问答模板中所包含的概念,
1) url ${url} 示例中字段抽取函数主要有三类,示例如下: ${职业} 直接引用“职业”字段的值,不做任何操作。 regexp_replace(${国籍}, '\(\[link\]@.*?:(/film.*?)\)', '') 将“国籍”字段中符合正则模式的“\(\[link\]@
建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。 单击“下一步”。 查看自动生成的本体结构,您也可以对本体进行修改。 单击“下一步”。 进入
Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。
创建图谱 为什么选择图谱规格时无法选中 如何创建知识图谱 什么是信息抽取 什么是字段抽取函数 什么是知识映射 什么是知识融合 怎样配置实体唯一标识字段 配置知识融合时,如何选择融合标识符和配置属性 属性融合依据的是哪一步的数据来配置的 配置信息抽取后,为什么查询不到实体数据 为何
过滤查询实体列表 功能介绍 根据图谱ID,过滤查看满足指定条件的实体列表,列表信息包括实体ID、实体类型、实体属性及其属性值。 URI POST /v1/{project_id}/kg/kg-instances/{kg_id}/entities/property-query 表1 路径参数
通过配置数据源、配置本体、配置信息抽取、配置知识映射和、配置知识融合、配置图谱质检,构建适用于自身业务的知识图谱。构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中