检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何创建知识图谱 构建图谱流程 KG服务为用户提供了两种方式构建图谱,不同的方式所需要的功能不同。基于不同的图谱构建方式,梳理了使用KG服务的主要流程。 图1 构建图谱流程 表1 构建图谱流程说明 主任务 说明 详细指导 购买知识图谱&选择图谱规格 在创建知识图谱之前,需要购买图谱并选择图谱规格。
侧导航栏选择“资源包(原我的套餐包)”,可查看已购买的知识图谱套餐包。 选择图谱规格 登录KG服务管理控制台,默认进入“我的图谱”页面。 单击,在创建图谱页面按表2填写信息。 图1 服务选型 表2 服务选型参数说明 参数 说明 “图谱名称” 待创建图谱的名称,名称只能由大小写字母
“OBS桶”:选择数据源文件存放的OBS桶。 “存储路径”:选择数据源文件存放在OBS桶的文件路径。 说明: 数据源存储的OBS路径不允许使用加密的OBS路径。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。
谱配置,适合复杂多变的业务场景。 图说KG 立即使用 成长地图 由浅入深,带您玩转KG 01 了解 了解华为云知识图谱的功能、基础知识和创建图谱的流程,有助于您更准确地匹配实际业务,一站式构建知识图谱。 产品介绍 什么是KG KG适用场景 KG基本知识 如何访问KG 03 实践
训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。 三元组类型 本样例构建的模型适用于人物、电影领域的信息抽取,限定抽取的三元组类型如表1所示。
我的图谱用户资源提示已冻结怎么办? 问题描述 “知识图谱控制台>我的图谱”页面,图谱的运行状态为“已冻结”。 解决方案 图谱规格为体验版图谱 由于当前知识图谱服务仅支持在控制台创建一次体验版图谱,即创建一次体验版图谱后,无法第二次创建体验版图谱。需要确认体验版图谱是否到期冻结。
什么是本体 本体是某个领域中抽象概念的集合,能够描述某个范围内一切事物的共有特征以及事物间的关系。例如图1可称作一个本体。详情请见本体简介。 图1 本体 父主题: 管理本体
不同数据源的知识在统一规范下进行异构数据整合、消歧,完成新知识图谱的创建。 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。
什么是知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
如果在创建图谱时配置了知识融合,存在被融合的实体,就需要进行融合验证,即验证当前知识融合的配置产生的结果是否符合预期。 背景介绍 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是
训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。 三元组类型 本样例构建的模型适用于人物、电影领域的信息抽取,限定抽取的三元组类型如表1所示。
选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图12 图谱本体 步骤6:配置信息抽取 以两条数据为例,抽取信息前后的实体信息如图13所示,展示如何配置信息抽取。
与其他服务的关系 知识图谱服务与周边服务的依赖关系如图1所示。 图1 知识图谱与依赖服务的关系 与统一身份认证服务的关系 知识图谱服务使用统一身份认证服务(Identity and Access Management,简称IAM)实现认证功能。IAM的更多信息请参见《统一身份认证服务用户指南》。
Brat BRAT是一个开源的文本标注工具,主要用于对文本的结构化标注,您可以前往官网下载。KG服务的预置模型框架支持直接利用BRAT关系三元组标注的结果来训练模型。注意您的标注任务仅限于BRAT的关系三元组标注,而且不要使用BRAT标注系统中的高级内容(如定义关系的自反性、传递性等)。
在导入本体对话框中,填写如下信息: “本体名称”:填写本体的名称。 “OBS桶”:选择提前准备的本体文件存放的OBS桶。 “存储路径”:选择提前准备的本体文件存放在OBS桶中的路径。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 图1
修改本体信息,新的本体信息会覆盖原有本体信息。而本章节所介绍的修改本体操作是基于某一个图谱版本使用的本体来修改本体信息,快速新建一个新的本体;同时会基于新的本体和当前图谱版本的数据生成一个新的图谱版本。 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。
报错原因一般是OBS桶或OBS对象加密,请检查OBS桶或OBS是否加密。 如果加密,请重新建一个不加密的OBS桶,即不要勾选“开启默认加密”。创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。 上传对象时不要勾选加密,OBS上传数据的详细操作请参见上传文件。 父主题: 创建图谱
上传数据至OBS 创建用于存储基础数据的OBS桶及文件夹,详情请见添加桶。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 将创建图谱的基础数据上传至OBS,上传至OBS的基础数据格式请见数据格式要求。
数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关的非结构化数据自
选择左侧“我的库”页签,在“图谱本体组件”中拖拽步骤1:创建本体中创建的本体“person_film”到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进