检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置信息抽取简介 在创建知识图谱时,当您选择本体后,您需要配置信息抽取,输入实体类型、抽取函数及抽取前后的数据字段,才能进行配置信息映射、配置知识融合等操作。 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。
系统内置模板 当用户问题对应的匹配模板的类型为系统内置模板(SYS_TEMPLATE)时,可参考系统内置模板列表。 表1 系统内置模板列表 模板 举例说明 实体名称 月光宝盒 xx实体 + 呢 月光宝盒呢 xx实体 的 xx属性 月光宝盒的上映时间 xx实体属性 + 呢 上映时间呢
信息抽取模型简介 KG服务提供自定义信息抽取模型功能,如果您希望在信息抽取时使用自定义的信息抽取模型,您可以在KG模型管理页面创建抽取模型、创建并发布模型版本,用于创建知识图谱过程中的信息抽取。 在KG服务管理控制台上自定义信息抽取模型是一种基于schema约束的中文信息抽取模型
信息抽取函数 结构化抽取适用于xlsx、csv、json格式的基础数据,选择结构化抽取方式信息抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示
表格配置模式 表格配置模式指通过填写基础数据映射前后的相关字段,完成知识映射配置。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 已完成信息抽取配置,详情请参见配置信息抽取。 操作步骤
什么是信息抽取 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围
配置信息抽取 配置信息抽取简介 结构化抽取 非结构化抽取
创建信息抽取模型 如果您在创建知识图谱时,选择使用自定义模型进行信息抽取,您需要在创建知识图谱之前,创建信息抽取模型。 本章节提供一个与人物、电影有关的非结构化数据构建信息抽取模型流程,帮助您快速熟悉知识图谱自定义信息抽取模型创建过程,通过在控制台进行数据标注、模型训练,构建一个
自定义信息抽取模型 信息抽取模型简介 准备训练数据 创建模型 管理版本
结构化抽取 信息抽取函数 交互界面配置 代码编辑 父主题: 配置信息抽取
管理版本 创建新版本 发布版本 修改版本 删除版本 父主题: 自定义信息抽取模型
发布版本 创建模型版本后,您需要通过发布操作,发布模型版本后,才能使对应的版本模型在创建知识图谱时用于信息抽取。 前提条件 已创建模型,并针对已创建的模型创建版本。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。
代码编辑 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 熟悉KG服务支持的信息抽取函数。 操作步骤 在普通配置构建图谱页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。
创建模型 在创建知识图谱之前,您可以在KG服务上通过选择模型框架和上传训练数据来创建模型,用于后续创建图谱过程中的信息抽取。 训练模型框架介绍 KG服务提供不同类型的关系抽取模型,以应对用户不同的条件与需求。 KG服务当前提供以下训练模型框架供您自定义模型: DGCNN是一个较为
非结构化抽取 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 如果选择使用自己自定义模型,您需要在创建知识图谱之前,自定义用于信息抽取的模型,具体操作请见自定义信息抽取模型。 操作步骤
准备训练数据 在创建抽取模型时,需要您提前准备用于训练模型的数据并上传至OBS目录,数据格式为txt文本的自然语言短句。KG服务当前支持的数据类型请参见训练数据类型介绍。 准备数据流程如下: 准备待标注的数据 定义三元组类型(schema) 标注数据 上传至OBS 准备待标注的数据
交互界面配置 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 熟悉KG服务支持的信息抽取函数。 操作步骤 在普通配置构建图谱页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。
删除版本 根据自身业务需要,您可以删除模型版本。处于“训练完成”、“训练失败”、“版本创建失败”和“停用”状态的模型版本才能进行删除操作,版本状态请参见查看模型。 操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模
修改版本 创建抽取模型后,针对处于“训练完成”和“停用”状态的模型版本,您可以根据自身业务需要,对模型版本进行修改优化。版本状态请参见查看模型。 操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击“模型名称”,进入模型详情页。
创建新版本 创建抽取模型后,您需要创建模型的版本,才能进行后续的发布操作,使模型在创建知识图谱时用于信息抽取。 每个模型最多可创建5个模型版本。 前提条件 在KG服务管理控制台创建抽取模型,详情请见创建模型。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 >