检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作步骤 在图谱流水线配置页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 图1 流水线配置页面 在“信息抽取”对话框中,“抽取方式”默认为“非结构化抽取”。 根据自身业务需要,您可以选择“公有库模型”、“预置模型”或者“用户自定义模型”,三者仅需选择一项。
数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关的非结构化数据自定
数据结构 公共响应参数 公共请求参数
非结构化数据创建图谱 创建图谱简介 创建信息抽取模型 使用自定义抽取模型创建图谱
结构化抽取 信息抽取函数 交互界面配置 代码编辑 父主题: 配置信息抽取
KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。 表1 信息抽取函数说明表 抽取函数 函数说明 抽取函数示例 抽取前数据示例 抽取后数据示例
N格式的数据属于结构化数据。 本章节提供一个与电影有关的结构化数据样例,帮助您快速熟悉知识图谱的创建过程。此样例通过在控制台创建本体,完成信息抽取、信息映射、信息融合、图谱质检的配置,创建一个与电影有关的知识图谱。创建完成后,您可以搜索预览相关实体的知识图谱,也可以在创建的图谱基础上全量更新或增量更新图谱。
使用公有资产库中的图谱流水线套件构建图谱 本章节提供一个与电影有关的非结构化数据样例,帮助您快速熟悉使用流水线套件构建知识图谱的过程,以及如何使用公有资产库中的图谱本体组件、模型组件。创建完成后,您可以搜索预览相关实体的知识图谱,也可以在创建的图谱基础上全量更新或增量更新图谱。
公共请求参数 表1 公共请求消息头 名称 描述 是否必选 示例 Content-type 发送的实体的MIME类型。 是 application/json Content-Length 请求body长度,单位为Byte。 POST/PUT请求为可选, GET不包含 3495 X-Auth-Token
已完成数据源配置,详情请参见配置数据源。 熟悉KG服务支持的信息抽取函数。 操作步骤 在普通配置构建图谱页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 在“信息抽取”对话框中,“抽取方式”选择“结构化抽取”,“编辑方式”选择“代码编辑”。 图1 信息抽取
熟悉KG服务支持的信息抽取函数。 操作步骤 在普通配置构建图谱页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 在“信息抽取”对话框中,“抽取方式”选择“结构化抽取”,“编辑方式”选择“交互界面”。 在“交互界面”页签填写信息抽取前后的相关字段时,
表1 公共响应消息头 名称 描述 Content-Length 响应消息体的字节长度,单位为Byte。 Date 系统响应的时间。 Content-type 发送的实体的MIME类型。 父主题: 数据结构
“OBS桶”:选择在步骤1:准备数据新建的OBS桶“kg-model”。 “文件夹”:选择在4中记录的V001.manifest文件的存储路径,并勾选存放的文件夹。 步骤6:创建模型版本 在KG服务管理控制台的左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入“模型管理”页面。 在模型列
什么是信息抽取 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围
“我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图12 图谱本体 步骤5:配置信息抽取 本样例使用在创建信息抽取模型中自定义的抽取模型进行信息抽取。
实体的知识图谱。 选择“模糊匹配”,输入实体名称部分字段,按回车进入图谱预览页面,预览实体名称含该字段的所有实体的知识图谱。 举例:输入实体名称“任霞”,按回车进入图谱预览页面,预览实体“任霞”的知识图谱。 单击右侧功能区域的图标,可查看图谱中的整个实体关系。 父主题: 管理图谱
配置信息抽取简介 在创建知识图谱时,当您选择本体后,您需要配置信息抽取,输入实体类型、抽取函数及抽取前后的数据字段,才能进行配置信息映射、配置知识融合等操作。 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。
即从原始数据中抽取结构化的信息。更多详情请见配置信息抽取。 字段抽取函数说明 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。
预览本体 在KG服务管理控制台创建本体后,您可以预览描述本体信息的结构图。 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在本体列表中,单击操作栏的“预览”,即可预览本体信息的结构图。 图1 预览本体 单击编辑框的概念节点或关系曲线。
什么是知识映射 建立从基础数据中抽取的结构化信息与所创建的知识图谱中的实体、属性、实体间相互关系的映射关系。 父主题: 创建图谱