检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
能使对应的版本模型在创建知识图谱时用于信息抽取。 前提条件 已创建模型,并针对已创建的模型创建版本。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。 在版本管理列表中的“操作”
OBS桶,并在您创建的OBS桶中创建文件夹,创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。然后再进行数据的上传,OBS上传数据的详细操作请参见上传文件。 由于当前KG部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG在同一区域,桶的存储类别为“标准存储”。
”状态的模型版本,您可以根据自身业务需要,对模型版本进行修改优化。版本状态请参见查看模型。 操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击“模型名称”,进入模型详情页。 在版本管理列表中的“操作”
创建抽取模型后,您需要创建模型的版本,才能进行后续的发布操作,使模型在创建知识图谱时用于信息抽取。 每个模型最多可创建5个模型版本。 前提条件 在KG服务管理控制台创建抽取模型,详情请见创建模型。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。
增量更新图谱 针对已经创建的知识图谱,您可以增量更新图谱,即在原有图谱的数据基础上增加新的数据更新知识图谱。 增量更新图谱 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片。 进入图谱详情页面。 单击右上角的“增量更新”。 进入“增量更新”页面
创建失败”和“停用”状态的模型版本才能进行删除操作,版本状态请参见查看模型。 操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。 在版本管理列表中的“操作”栏,单击“删除”。
准确率:在被所有预测为正的样本中实际为正样本的概率。 召回率:在实际为正的样本中被预测为正样本的概率。 F1:综合考虑准确率和召回率的影响,由两者计算而来,越接近1代表模型越好。 训练数据路径 已发布版本的模型,其训练数据的OBS存储目录。 更新时间 已发布的模型版本的更新时间。 状态
如何访问知识图谱 知识图谱服务提供了Web化的服务管理平台,即管理控制台和基于HTTPS请求的API(Application programming interface)管理方式。 管理控制台方式 KG服务提供了简洁易用的管理控制台,包含配置数据源、图谱本体、信息抽取、知识映射、
结构化抽取适用于xlsx、csv、json格式的基础数据,选择结构化抽取方式信息抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取
希望在信息抽取时使用自定义的信息抽取模型,您可以在KG模型管理页面创建抽取模型、创建并发布模型版本,用于创建知识图谱过程中的信息抽取。 在KG服务管理控制台上自定义信息抽取模型是一种基于schema约束的中文信息抽取模型,即从自然语言文本中抽取三元组的模型,因此仅适用于抽取基础数据格式为txt文本的自然语言短句。
“OBS桶”:选择数据源文件存放的OBS桶。 “存储路径”:选择数据源文件存放在OBS桶的文件路径。 说明: 数据源存储的OBS路径不允许使用加密的OBS路径。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。
选择左侧“我的库”页签,在“图谱本体组件”中拖拽合适的本体到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“本体管理”页面创建或OBS导入的所有本体。 “公有库”页签下的“图谱本体组件”呈现的是KG服务预置的本体,如果有满足您需求的本体,您也可以直接拖拽使用。
选择左侧“我的库”页签,在“图谱本体组件”中拖拽步骤1:创建本体中创建的本体“person_film”到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进
用于自身业务的知识图谱。构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取
用于自身业务的知识图谱。构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取
信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。 通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取的配置。 配置信息抽取 配置知识映射 - 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系。 通过设置映射前后的相关字段,完成知识映射的信息配置。 配置知识映射
处理能力,理解用户所提出的问题,并利用知识图谱中的结构化知识进行查询、推理,找到解决该问题的精准答案并反馈给用户,协助用户解决不同类型的问题。 问答配置完成后,可在问答体验页面针对当前图谱的知识提出问题,KBQA服务会根据您的提问查询和推理当前知识图谱的知识库,并返回精准答案。 前提条件
模型训练,构建一个人物、电影有关的信息抽取模型,在自定义抽取模型的基础上去创建图谱。 使用公有资产库中的图谱流水线套件构建图谱 本实践提供一个与电影有关的非结构化数据样例,以便用户快速熟悉使用流水线套件构建知识图谱的过程,以及如何使用公有资产库中的图谱本体组件、模型组件。创建完成
击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示: 图2 信息抽取 {
训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。 三元组类型 本样例构建的模型适用于人物、电影领域的信息抽取,限定抽取的三元组类型如表1所示。