检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置信息抽取简介 在创建知识图谱时,当您选择本体后,您需要配置信息抽取,输入实体类型、抽取函数及抽取前后的数据字段,才能进行配置信息映射、配置知识融合等操作。 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。
图谱导入”进行恢复。 导出的图谱版本包含以下信息: csv文件夹:存放csv源数据文件 ontology.json:图谱本体配置文件 pipeline_config.json:流水线配置文件 操作步骤 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。
基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在通过普通抽取方式进行信息抽取时,即用交互界面配置或用格式化编辑进行信息抽取时,需要配置字段抽取函数。配置字段抽取函数后,KG
基础数据格式为xlsx、csv、json格式 交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 交互界面配置 代码编辑:将交互界面中的配置转换为json格式配置,通过编辑json配置信息,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。
配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。 代码配置模式:通过编辑json格式代码,完成知识映射配置。具体步骤请见代码配置模式。 进行知识映射时,表格配置模式、代码配置模式可以相互切换。 知识映射配置完成后,鼠标悬浮在知识
什么是知识映射 建立从基础数据中抽取的结构化信息与所创建的知识图谱中的实体、属性、实体间相互关系的映射关系。 父主题: 创建图谱
配置图谱质检 图谱质检对流水线构建中的数据源、信息抽取、知识映射、知识融合提供质量检查,辅助用户定位构建中出现的问题。从知识的准确性、一致性、完整性、时效性、重复性五种维度出发,为用户提供通用且全面的评估,并输出质检报告,详见查看质检报告。 配置步骤 在普通配置构建图谱页面,单击
片,单击“图谱构建WorkSpace”。 进入普通配置构建图谱页面。 图1 普通配置构建 操作步骤 在普通配置构建图谱页面,单击“数据源”,页面下方弹出数据源配置对话框,单击右侧按钮可以放大对话框。 图2 配置数据源 在数据源配置对话框,填写相关信息。 “选择数据格式”:构建图谱
多项目时,展开“所属区域”,从“项目ID”列获取子项目ID。 调用API获取项目ID 项目ID还用通过调用查询指定条件下的项目信息API获取。 获取项目ID的接口为“GET https://{Endpoint}/v3/projects”,其中{Endpoint}为IAM的终端节点,可以从地区和终端
普通配置构建图谱 普通配置构建图谱需要通过配置数据源、配置图谱本体、配置信息抽取、配置知识映射、配置知识融合、配置图谱质检等流水线步骤,构建适用于自身业务的知识图谱。 前提条件 已注册华为账号,并完成实名认证。具体申请信息请见账号注册和实名认证。 KG服务当前为商用阶段,为保证K
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 知识图谱服务的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 表1 知识图谱的终端节点 区域名称 区域 终端节点(Endpoint) 华北-北京四
文件,即表格文件作为数据源时,文件必须为.xlsx格式,文件中每一个工作簿为一类数据,工作簿名为数据类型名。每个工作簿中,第一行为数据头,从第二行开始,每一行为一条数据。XLSX文件模板示例请单击下载。 CSV文件 该类型为结构化数据输入格式。使用CSV文件作为数据源时,首先需要
初步筛选与融合标识符相似的数据后,需要配置相似属性和相似度函数,并判断数据之间的属性相似度。 融合知识 对属性相似度均达到阈值条件的数据进行融合。 综上所述,在创建图谱的过程中,需要配置知识融合的融合标识符、待融合的实体、相似度函数和相似度阈值等参数,KG服务会根据所配置的参数进行知识融合。配置知识融合的详细步骤请见配置知识融合。
结构化抽取适用于xlsx、csv、json格式的基础数据,选择结构化抽取方式信息抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应请求
抽取模型 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 后续操作 配置信息抽取后,进入创建图谱的下一步操作配置知识映射。 父主题: 配置信息抽取
(Knowledge Graph,简称KG) 。知识图谱是面向各类企业的一站式知识计算平台,提供本体管理、图谱管理、图谱构建等功能,帮助用户从0到1快速构建知识图谱,管理知识图谱流水线任务。 在调用知识图谱服务API之前,请确保已经充分了解知识图谱服务相关概念,详细信息请参见产品介绍。
图1 本体 数据源配置 数据是知识图谱的基础。创建知识图谱之前,必须收集基础数据用来构建知识图谱。 在知识图谱服务中,需要提前从OBS导入用于构建知识图谱的基础数据。 信息抽取 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化
代码配置模式 格式化编辑指通过编辑json格式代码,完成知识映射配置。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 已完成信息抽取配置,详情请参见配置信息抽取。 操作步骤 在普通配
单击知识图谱问答KBQA卡片下方的“问答配置”,默认进入“元素链接配置”页面。 图1 问答配置 单击页面上方的“问答模板配置”,切换至问答模板配置页面。 单击“创建”,填写如下配置信息,然后单击右下角的“保存”。 配置基本信息 配置问答模板(交互) 配置问答模板(代码编辑) 填写完配置信息,您也可以单击