检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理版本 创建新版本 发布版本 修改版本 删除版本 父主题: 自定义信息抽取模型
映射,设置抽取映射前后的相关字段。 基本概念 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。
“编辑方式”选择“表格配置模式”,填写知识映射的相关信息。 配置实体的概念映射:在对应实体下方的“概念映射”区域填写映射前的实体类型字段。 配置实体的属性映射:在对应实体下方的“属性映射”区域填写映射到实体各个属性的“抽取项”。 配置实体的关系映射:在对应实体下方的“关系映射”区域填写映射到各个实体关系的“抽取项”和“尾实体类型”。
结构化抽取 信息抽取函数 交互界面配置 代码编辑 父主题: 配置信息抽取
放未标注的数据集。 创建名称为“model-data-out”的文件夹用于存放已标记并发布的数据集。 创建名称为“graph-data”的文件夹用于存放创建图谱的数据集。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访问,请务必保证创建的OBS桶与KG
可在下方查看从文本信息中抽取的知识类型,知识类型包括主语“Subject_type”、谓语“Predicate”、宾语“Object_type”,即可查看到可抽取的主语、谓语、宾语组合。 图2 抽取模型 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
在创建抽取模型时,需要您提前准备用于训练模型的数据并上传至OBS目录,数据格式为txt文本的自然语言短句。KG服务当前支持的数据类型请参见训练数据类型介绍。 准备数据流程如下: 准备待标注的数据 定义三元组类型(schema) 标注数据 上传至OBS 准备待标注的数据 准备待标注的训练数据,并保存至本地
力,理解用户所提出的问题,并利用知识图谱中的结构化知识进行查询、推理,找到解决该问题的精准答案并反馈给用户,协助用户解决不同类型的问题。KBQA提供如下问答配置功能: 配置元素链接 通过配置元素链接,即配置图谱中概念以及概念属性、概念间的关系的同义词和权重,对用户输入的文本进行语
抽取,输入实体类型、抽取函数及抽取前后的数据字段,才能进行配置信息映射、配置知识融合等操作。 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取
击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示: 图2 信息抽取 {
希望在信息抽取时使用自定义的信息抽取模型,您可以在KG模型管理页面创建抽取模型、创建并发布模型版本,用于创建知识图谱过程中的信息抽取。 在KG服务管理控制台上自定义信息抽取模型是一种基于schema约束的中文信息抽取模型,即从自然语言文本中抽取三元组的模型,因此仅适用于抽取基础数据格式为txt文本的自然语言短句。
说明 数据类别 基础数据中描述实体类型的字段。 抽取项名称 抽取信息后的属性字段。 抽取函数 抽取信息时所使用的引用字段的信息抽取函数,具体请见信息抽取函数。 确认所填写的信息后,单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
配置问答模板 创建问答模板 导入/导出问答模板 测试问答模板 发布问答模板 查看问答模板配置 编辑问答模板配置 删除/批量删除问答模板 父主题: 知识图谱问答KBQA服务
结构化抽取适用于xlsx、csv、json格式的基础数据,选择结构化抽取方式信息抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取
查询关联实体 功能介绍 指定知识图谱实例ID,在ID对应的知识图谱后端,查询与指定实体有一跳关系的实体,返回满足条件的实体列表。 URI GET /v1/{project_id}/kg/kg-instances/{kg_id}/entities/{entity_id}/adjacent-entities
0302-1963128-1”,表示ID为4730302的实体和ID为1963128的实体之间的第1个关系。 index String 关系的索引值,标识该条关系是其头尾实体的第几个关系。 label String 关系的类型。 source String 关系头实体ID。 target
选择左侧“我的库”页签,在“图谱本体组件”中拖拽步骤1:创建本体中创建的本体“person_film”到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进
语义搜索与推荐 建立用户搜索输入的关键词与知识图谱中的实体之间的映射关系,为用户推荐满足用户需求的结构化信息内容,而不是互联网网页。 图1 知识图谱与语义搜索 智能问答系统 基于知识的问答系统建立大规模知识库,通过理解将用户的问题转化为对知识图谱的查询,提供用户所关心的问题答案。 图2
修订记录 发布日期 修改说明 2024-04-14 修改“帐”为“账”。 2019-09-13 第一次正式发布。
管理图谱 如何全量更新图谱 如何查看图谱中的整个实体关系 如何增量更新图谱 图谱版本更新后,历史版本是否支持图谱预览