检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置信息抽取 配置信息抽取简介 结构化抽取 非结构化抽取
配置图谱质检 图谱质检对流水线构建中的数据源、信息抽取、知识映射、知识融合提供质量检查,辅助用户定位构建中出现的问题。从知识的准确性、一致性、完整性、时效性、重复性五种维度出发,为用户提供通用且全面的评估,并输出质检报告,详见查看质检报告。 配置步骤 在普通配置构建图谱页面,单击
描述本体信息的结构图。 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在本体列表中,单击操作栏的“预览”,即可预览本体信息的结构图。 图1 预览本体 单击编辑框的概念节点或关系曲线。 左侧弹出信息框,可查看对应的名称、属性和属性类型等信息。
理解用户所提出的问题,并利用知识图谱中的结构化知识进行查询、推理,找到解决该问题的精准答案并反馈给用户,协助用户解决不同类型的问题。KBQA提供如下问答配置功能: 配置元素链接 通过配置元素链接,即配置图谱中概念以及概念属性、概念间的关系的同义词和权重,对用户输入的文本进行语义解
进入“增量更新”页面,通过配置数据源、配置信息抽取、配置知识映射、配置知识融合、配置图谱质检等流水线步骤,构建增量图谱。 在“增量更新”页面,依次完成数据源配置、信息抽取、知识映射、知识融合、图谱质检的配置,详细的操作指引请见表1。 “增量更新”页面入口与“创建知识图谱”页面入口不同,但是增量更新中的配置操作均与创建知识图谱操作相同。
进入“增量更新”页面,通过配置数据源、配置信息抽取、配置知识映射、配置知识融合、配置图谱质检等流水线步骤,构建增量图谱。 在“增量更新”页面,依次完成数据源配置、信息抽取、知识映射、知识融合、图谱质检的配置,详细的操作指引请见表1。 “增量更新”页面入口与“创建知识图谱”页面入口不同,但是增量更新中的配置操作均与创建知识图谱操作相同。
才能使对应的版本模型在创建知识图谱时用于信息抽取。 前提条件 已创建模型,并针对已创建的模型创建版本。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。 在版本管理列表中的“操作
已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 如果选择使用自己自定义模型,您需要在创建知识图谱之前,自定义用于信息抽取的模型,具体操作请见自定义信息抽取模型。 操作步骤 在图谱流水线配置页面,单击“信息抽取”,页面下方弹出“信息
信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在通过普通抽取方式进行信息抽取时,即用交互界面配置或用格式化编辑进行信息抽取时,需要配置字段抽取函数。配置字段抽取函数后,KG服务会根据所配置的字段抽取函数进
在“质检结果总览”页签,您可以查看流水线构建各个步骤的质检结果概况。 图2 质检结果总览 单击配置步骤,进入“流水线配置质检”页签,您可以查看所选配置步骤的质检详情。 图3 流水线配置质检 父主题: 管理图谱版本
训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。 三元组类型 本样例构建的模型适用于人物、电影领域的信息抽取,限定抽取的三元组类型如表1所示。
结构化抽取 信息抽取函数 交互界面配置 代码编辑 父主题: 配置信息抽取
配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取 配置实体类型和对应数据字段信息。 配置知识映射 配置映射前后的数据字段。 配置知识融合 配置知识融合的相关属性和相似函数。 配置图谱质检 配置图谱质检开关。 知识图谱概念和创建图谱流程的基本概念请参见基本知识。
配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取 配置实体类型和对应数据字段信息。 配置知识映射 配置映射前后的数据字段。 配置知识融合 配置知识融合的相关属性和相似函数。 配置图谱质检 配置图谱质检开关。 知识图谱概念和创建图谱流程的基本概念请参见基本知识。
它的上映日期 上一个实体 的 xx关系(正向) 他主演的电影 上一个实体 的 xx关系 的 xx关系(正向二跳关系) 她导演的电影的主演 上一个实体 和 xx实体 的关系 它和月光宝盒的关系 上一个实体 的 xx关系 的 xx属性(正向一跳关系的属性) 他主演的电影的上映时间 父主题:
单击,可以查看与该实体有关系的局部图谱数据。 单击,可以查看力引导布局的图谱。 单击,可以查看圆形布局的图谱。 单击,可以查看网格布局的图谱。 单击,可以查看分层布局的图谱。 单击,可以查看自动分群布局的图谱。 单击,可以下载当前图谱画面。 预览图谱 在图谱预览页面,您可以查看到所搜索的实体信息。
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 知识图谱服务的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 表1 知识图谱的终端节点 区域名称 区域 终端节点(Endpoint) 华北-北京四
登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。 在图谱版本列表中单击操作栏的“更多 > 导出”。 图1 导出图谱 在图谱导出对话框中,选择导出的“OBS桶”和“存储路径”。所选的OBS桶需保证与KG服务在同一区域,桶的存储类别为“标准存储”。
处理能力,理解用户所提出的问题,并利用知识图谱中的结构化知识进行查询、推理,找到解决该问题的精准答案并反馈给用户,协助用户解决不同类型的问题。 问答配置完成后,可在问答体验页面针对当前图谱的知识提出问题,KBQA服务会根据您的提问查询和推理当前知识图谱的知识库,并返回精准答案。 前提条件
“我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图12 图谱本体 步骤5:配置信息抽取 本样例使用在创建信息抽取模型中自定义的抽取模型进行信息抽取。