检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 交互界面配置 代码编辑:将交互界面中的配置转换为json格式配置,通过编辑json配置信息,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 代码编辑 非结构化抽取 基础数据格式为txt文本的自然语言短句 通过选择合适的算法,完成信息抽取配置。
信息抽取函数 结构化抽取适用于xlsx、csv、json格式的基础数据,选择结构化抽取方式信息抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示
交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 交互界面配置 代码编辑:将交互界面中的配置转换为json格式配置,通过编辑json配置信息,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 代码编辑 非结构化抽取
如果选择使用自己自定义模型,您需要在创建知识图谱之前,自定义用于信息抽取的模型,具体操作请见自定义信息抽取模型。 操作步骤 在图谱流水线配置页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 图1 流水线配置页面 在“信息抽取”对话框中,“抽取方式”默认为“非结构化抽取”。
为何知识图谱无法运行,提示“错误的信息抽取函数” 问题描述 知识图谱无法运行,提示“错误的信息抽取函数”。 可能原因 流水线信息抽取配置有误。 解决方案 检查信息抽取函数和配置信息抽取时所填的参数。 知识图谱服务支持的信息抽取函数具体请参见信息抽取函数。配置信息抽取操作请参见配置信息抽取。 以创建
信息抽取模型简介 KG服务提供自定义信息抽取模型功能,如果您希望在信息抽取时使用自定义的信息抽取模型,您可以在KG模型管理页面创建抽取模型、创建并发布模型版本,用于创建知识图谱过程中的信息抽取。 在KG服务管理控制台上自定义信息抽取模型是一种基于schema约束的中文信息抽取模型
训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 上传至OBS 将用于训练模型的数据上传至OBS目录: 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。确保您使用的OBS目录与KG服务在同一区域,桶的存储类别为“标准存储”。
训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。 三元组类型 本样例构建的模型适用于人物、电影领域的信息抽取,限定抽取的三元组类型如表1所示。
数据类别 基础数据中描述实体类型的字段。 抽取项名称 抽取信息后的属性字段。 抽取函数 抽取信息时所使用的引用字段的信息抽取函数,具体请见信息抽取函数。 确认所填写的信息后,单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
图标说明开关处于关闭状态,需要编辑json格式代码。 在“信息抽取”对话框下方编辑json格式代码。 在“代码编辑”页签编辑json代码配置信息抽取时,可单击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
配置信息抽取后,为什么查询不到实体数据 问题描述 配置信息抽取后,查询不到实体数据。 问题原因 创建图谱后,需要发布图谱版本,才能查询图谱中的实体数据。 发布图谱版本 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。 默认在
Brat BRAT是一个开源的文本标注工具,主要用于对文本的结构化标注,您可以前往官网下载。KG服务的预置模型框架支持直接利用BRAT关系三元组标注的结果来训练模型。注意您的标注任务仅限于BRAT的关系三元组标注,而且不要使用BRAT标注系统中的高级内容(如定义关系的自反性、传递性等)。
配置信息抽取 配置信息抽取简介 结构化抽取 非结构化抽取
能使对应的版本模型在创建知识图谱时用于信息抽取。 前提条件 已创建模型,并针对已创建的模型创建版本。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。 在版本管理列表中的“操作”
自定义信息抽取模型 信息抽取模型简介 准备训练数据 创建模型 管理版本
结构化抽取 信息抽取函数 交互界面配置 代码编辑 父主题: 配置信息抽取
创建抽取模型后,您需要创建模型的版本,才能进行后续的发布操作,使模型在创建知识图谱时用于信息抽取。 每个模型最多可创建5个模型版本。 前提条件 在KG服务管理控制台创建抽取模型,详情请见创建模型。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。
管理版本 创建新版本 发布版本 修改版本 删除版本 父主题: 自定义信息抽取模型
创建失败”和“停用”状态的模型版本才能进行删除操作,版本状态请参见查看模型。 操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。 在版本管理列表中的“操作”栏,单击“删除”。
”状态的模型版本,您可以根据自身业务需要,对模型版本进行修改优化。版本状态请参见查看模型。 操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击“模型名称”,进入模型详情页。 在版本管理列表中的“操作”