检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何创建本体 创建本体方式 方式一:控制台创建本体 方式二:OBS导入本体 父主题: 管理本体
取模型创建知识图谱的流程,帮助您快速熟悉知识图谱自定义信息抽取模型创建过程和使用非结构化数据创建图谱的过程。步骤如下: 创建信息抽取模型:以在ModelArts控制台上标注数据为例,介绍信息抽取模型的构建流程。 使用自定义抽取模型创建图谱:介绍通过自定义的信息抽取模型创建知识图谱的流程。
非结构化数据创建图谱 创建图谱简介 创建信息抽取模型 使用自定义抽取模型创建图谱
知识图谱的计费规格,一万条边、百万边、千万边具体指什么 知识图谱的数据存储在图数据库,图数据库基本数据类型包含点和边。 点代表实体。如交通网络中的车辆、通信网络中的站点、电商交易网络中的用户和商品、互联网中的网页等。 边代表关系。如社交网络中的好友关系、电商交易网络中用户评分和购买行为、论文
数据是知识图谱的基础。在创建知识图谱时,基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 提前准备好创建图谱的数据并上传至OBS,详情请参见准备图谱数据。 进入图谱创建页面 在“我的图谱”页面
创建本体 控制台创建本体 OBS导入本体 父主题: 管理本体
如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以创建一个有关于电影的知识图谱为例,抽取信息前后的实体信息如图2所示,展示如何在创建图谱时配置信息抽取。 图2 信息抽取 按配置数据源为待创建的图谱配置数据源。 按配置图谱本体为待创建的图谱选择本体。
步骤5:创建模型 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表左上方,单击“创建模型”。 弹出“创建模型”对话框。 图11 创建模型 在“创建模型”对话框中填写相关信息,如图11所示,单击“确定”,完成模型创建。 “模
步骤1:准备数据 在创建图谱之前,您需要将用于创建图谱的基础数据上传至OBS桶及文件夹。 登录OBS服务控制台,创建桶和文件夹,用于存放样例数据集,创建名称为“kg-test”的OBS桶,名称为“demo-data”的文件夹。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。
欠费或冻结状态。 已自定义信息抽取模型,详情请见创建信息抽取模型。 步骤1:创建本体 在创建信息抽取模型中自定义的信息抽取模型需要从本章节待创建的图谱数据中抽取三元组信息,因此我们在创建本体时可以参考表1中的三元组类型。 图1 创建本体 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库
登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入“模型管理”页面。 在模型列表左上方,单击“创建模型”。 弹出“创建模型”对话框,如图1所示。 图1 创建模型 按表1填写相关信息。 表1 创建模型参数说明 参数 说明 模型名称 模型的名称。暂不支持修改。 模型模板 选择训练
创建新版本 创建抽取模型后,您需要创建模型的版本,才能进行后续的发布操作,使模型在创建知识图谱时用于信息抽取。 每个模型最多可创建5个模型版本。 前提条件 在KG服务管理控制台创建抽取模型,详情请见创建模型。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 >
“确定”。 进入“创建本体”界面。 图1 创建本体 在“创建本体”页面,您可以手动创建概念和概念间的关系,并编辑概念,如图2所示。 在创建本体时,所有概念都默认有一个属性为“name”,且默认属性类型为“single_string”。 图2 创建本体 创建本体操作如下: 新建概念
配置信息抽取后,为什么查询不到实体数据 问题描述 配置信息抽取后,查询不到实体数据。 问题原因 创建图谱后,需要发布图谱版本,才能查询图谱中的实体数据。 发布图谱版本 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。 默认在
已通过流水线配置完成构建的知识图谱,如果想要修改数据,可通过全量更新或增量更新图谱的方式,更新图谱。 全量更新图谱 针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。 增量更新图谱 针对已经创建的知识图谱,您可以增量更新图谱,即在原有图谱的数据基础上增加新的数据更新知识图谱。 更新完图谱
属性融合依据的是哪一步的数据来配置的 属性融合依据的是您图谱里现有的实体和您创建图谱或更新图谱时新加入的实体,如果是首次创建图谱,那就没有现有实体。 在创建知识图谱时,当您配置知识映射后,您需要配置知识融合,设置知识融合判断属性及相似度函数参数,完成新知识图谱的创建。 实体需要融合,因为有时候数据中会有多个实体
发布版本 创建模型版本后,您需要通过发布操作,发布模型版本后,才能使对应的版本模型在创建知识图谱时用于信息抽取。 前提条件 已创建模型,并针对已创建的模型创建版本。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。
自定义信息抽取模型的流程如表1所示。 表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据 提前准备用于训练模型的数据。 准备训练数据 创建模型 基于您的训练数据(即已标注数据),您可以在KG服务中创建信息抽取模型。 创建模型 创建新版本 创建模型后,您需要创建模型版本,方便后续版本发布和模型调优。
将用于训练模型的数据上传至OBS目录: 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。确保您使用的OBS目录与KG服务在同一区域,桶的存储类别为“标准存储”。 上传训练数据请参考上传文件。 后续操作 准备训练数据后,即可在KG服务上创建信息抽取模型,详情请见创建模型。 父主题: 自定义信息抽取模型
实体唯一标识字段 实体唯一标识字段指能识别每个数据的唯一字段,该字段在所有数据中具有唯一性,能唯一代表所对应的数据,类似于数据的“身份证”。 例如如下数据的唯一标识字段为“url” ,因为该字段能唯一代表该数据,因此在配置实体唯一标识字段时,“唯一标识字段”的文本框中填写“url”。 "{