检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
结构化抽取适用于xlsx、csv、json格式的基础数据,选择结构化抽取方式信息抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函
基于知识的问答系统建立大规模知识库,通过理解将用户的问题转化为对知识图谱的查询,提供用户所关心的问题答案。 图2 知识图谱与智能问答 大数据分析与决策 知识图谱通过语义链接帮助理解大数据,获得对大数据的洞察,提供决策支持,应用于各个行业,例如股票投研情报分析,通过抽取公司的股东、子公司、供
什么是知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
Content-Length 响应消息体的字节长度,单位为Byte。 Date 系统响应的时间。 Content-type 发送的实体的MIME类型。 父主题: 数据结构
知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 配置知识融合后,知识图谱服务会对数据按配置规则进行
G... X-Language 请求语言类型。 否,默认为zh-cn en-us 其它header属性,请遵照https协议。 父主题: 数据结构
支持创建知识图谱流水线任务,生成知识图谱。 支持编辑知识图谱流水线任务信息,包括数据源选择、图谱本体配置、信息抽取配置、知识映射信息配置、知识融合信息配置、图谱质检配置。 支持增量数据,更新图谱。 支持图谱预览、图谱版本管理。 创建图谱流程 智能一键构建图谱 只需提供源数据,无需其他配置,即可快速构建图谱。详细操作步骤请见一键智能构建图谱。
知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。 代码配置模式:通过编辑js
导出图谱 对于已经创建的图谱版本,支持导出图谱版本至OBS桶。导出的图谱可以通过“全量更新 > 图谱导入”进行恢复。 导出的图谱版本包含以下信息: csv文件夹:存放csv源数据文件 ontology.json:图谱本体配置文件 pipeline_config.json:流水线配置文件
”。 单击“保存”,完成知识映射。 如果创建多个数据源,请完成所有数据源的知识映射配置。配置数据源请参见配置数据源。 示例 以创建一个有关于电影的知识图谱为例,展示如何在创建图谱时配置知识映射。 按配置数据源为待创建的图谱配置数据源。 按配置图谱本体为待创建的图谱选择本体。 按配
在发布数据集时,“版本格式”选择“Default”。 ModelArts发布的标注数据集是“.manifest”格式的文件,其中包含多行,每行是一个JSON格式的标注样例。 前提条件 准备训练数据并上传至OBS目录,详细步骤请参见准备训练数据,数据类型和要求请见训练数据类型介绍。
配置信息抽取,输入实体类型、抽取函数及抽取前后的数据字段,才能进行配置信息映射、配置知识融合等操作。 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结
产品介绍 什么是KG KG适用场景 KG基本知识 如何访问KG 03 实践 通过提供针对性场景的知识数据样例,方便您快速了解使用KG完成知识图谱创建的流程和操作。 KG创建图谱样例 创建电影图谱 04 API 通过KG开放的API和调用示例,您可以使用KG查询知识图谱、查询实体详情、过
见表1。 图3 创建流程图 表1 创建流程表 流程 方法 说明 详细指导 配置数据源 - 数据是知识图谱的基础。 基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。 配置数据源 配置图谱本体 - 您可以选择已在控制台创建的本体,或者选择从OBS导入的本体,用于组织待创建图谱的信息结构。
请求什么类型的操作。 GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。当资源不存在的时
怎样配置实体唯一标识字段 实体唯一标识字段 实体唯一标识字段指能识别每个数据的唯一字段,该字段在所有数据中具有唯一性,能唯一代表所对应的数据,类似于数据的“身份证”。 例如如下数据的唯一标识字段为“url” ,因为该字段能唯一代表该数据,因此在配置实体唯一标识字段时,“唯一标识字段”的文本框中填写“url”。
代码配置模式 格式化编辑指通过编辑json格式代码,完成知识映射配置。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 已完成信息抽取配置,详情请参见配置信息抽取。 操作步骤 在普通配
发布图谱版本 针对全量更新的图谱、增量更新的图谱、通过复制快速创建的图谱,您可以发布图谱版本。只有发布图谱版本后,才能查询图谱中的实体数据。 前提条件 已全量更新图谱或增量更新图谱。 发布图谱版本 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。
知识图谱的计费规格,一万条边、百万边、千万边具体指什么 知识图谱的数据存储在图数据库,图数据库基本数据类型包含点和边。 点代表实体。如交通网络中的车辆、通信网络中的站点、电商交易网络中的用户和商品、互联网中的网页等。 边代表关系。如社交网络中的好友关系、电商交易网络中用户评分和购
待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。