检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在普通配置构建图谱页面,单击“数据源”,页面下方弹出数据源配置对话框,单击右侧按钮可以放大对话框。 图2 配置数据源 在数据源配置对话框,填写相关信息。 “选择数据格式”:构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”、“短文本”,详情请见数据格式要求。 “选择数据源文件”:单击
准备训练数据 在创建抽取模型时,需要您提前准备用于训练模型的数据并上传至OBS目录,数据格式为txt文本的自然语言短句。KG服务当前支持的数据类型请参见训练数据类型介绍。 准备数据流程如下: 准备待标注的数据 定义三元组类型(schema) 标注数据 上传至OBS 准备待标注的数据
数据结构 公共响应参数 公共请求参数
非结构化数据创建图谱 创建图谱简介 创建信息抽取模型 使用自定义抽取模型创建图谱
准备图谱数据 数据是知识图谱的基础。在创建知识图谱时,需要提前将创建图谱的数据上传至OBS。 数据格式要求 XLSX文件 该类型为结构化数据输入格式。使用XLSX文件,即表格文件作为数据源时,文件必须为.xlsx格式,文件中每一个工作簿为一类数据,工作簿名为数据类型名。每个工作簿
如何上传基础数据至OBS 使用KG创建知识图谱时,首先需要将基础数据上传至华为云对象存储服务(OBS)桶中。您可以登录OBS管理控制台创建OBS桶,并在您创建的OBS桶中创建文件夹,创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。然后再进行数据的上传,OBS上传数据的详细操作请参见上传文件。
创建图谱简介 数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关
结构化数据创建图谱 数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从对象存储服务(Object Storage Service,简称OBS)导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中
属性 说明 数据类别 基础数据中描述实体类型的字段。 抽取项名称 抽取信息后的属性字段。 抽取函数 抽取信息时所使用的引用字段的信息抽取函数,具体请见信息抽取函数。 确认所填写的信息后,单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
配置信息抽取后,为什么查询不到实体数据 问题描述 配置信息抽取后,查询不到实体数据。 问题原因 创建图谱后,需要发布图谱版本,才能查询图谱中的实体数据。 发布图谱版本 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。 默认在
配置完流水线的图谱,如何修改数据 已通过流水线配置完成构建的知识图谱,如果想要修改数据,可通过全量更新或增量更新图谱的方式,更新图谱。 全量更新图谱 针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。 增量更新图谱 针对已经创建的知识图谱,您可以增量更新图
属性融合依据的是哪一步的数据来配置的 属性融合依据的是您图谱里现有的实体和您创建图谱或更新图谱时新加入的实体,如果是首次创建图谱,那就没有现有实体。 在创建知识图谱时,当您配置知识映射后,您需要配置知识融合,设置知识融合判断属性及相似度函数参数,完成新知识图谱的创建。 实体需要融
知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 配置知识融合后,知识图谱服务会对数据按配置规则进行
在“我的图谱”页面,单击待查看的图谱卡片,进入图谱详情页面,可查看如下信息。 在线版本图谱 图谱应用 版本统计 图1 图谱详情 在线版本图谱 可查看当前在线图谱的基本信息,包括“运行状态”、“图谱ID”、“实体个数”、“关系个数”等。 图2 在线版本图谱 图谱应用 针对已创建的知识图谱提供如下服务。 “知识图谱预览查询”
Content-Length 响应消息体的字节长度,单位为Byte。 Date 系统响应的时间。 Content-type 发送的实体的MIME类型。 父主题: 数据结构
G... X-Language 请求语言类型。 否,默认为zh-cn en-us 其它header属性,请遵照https协议。 父主题: 数据结构
单击下方“保存当前页”。 步骤4:发布数据集 在ModelArts管理控制台的左侧菜单栏中单击“数据管理>数据集”,进入数据集页面。 在数据集列表中,单击数据集“RelationExtraction”操作列的“发布”。 或者,您可以单击数据集名称,进入数据集概览页,在页面右上角单击“发布”。
在数据源配置对话框,填写相关信息。 “选择数据格式”:此样例选择“XLSX”。 “选择数据源文件”:单击,弹出“选择数据源文件”对话框,选择数据源存放在OBS的路径: “OBS桶”:选择数据源文件存放的OBS桶“kg-test”。确保您使用的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。
怎样配置实体唯一标识字段 实体唯一标识字段 实体唯一标识字段指能识别每个数据的唯一字段,该字段在所有数据中具有唯一性,能唯一代表所对应的数据,类似于数据的“身份证”。 例如如下数据的唯一标识字段为“url” ,因为该字段能唯一代表该数据,因此在配置实体唯一标识字段时,“唯一标识字段”的文本框中填写“url”。
函数参数,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧,完成新知识图谱的创建。 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是