检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。 代码配置模式:通过编辑json格式代码,完成知识映射配置。具体步骤请见代码配置模式。 进行知识映射时,表格配置模式、代码配置模式可以相互切换。
适用场景 语义搜索与推荐 建立用户搜索输入的关键词与知识图谱中的实体之间的映射关系,为用户推荐满足用户需求的结构化信息内容,而不是互联网网页。 图1 知识图谱与语义搜索 智能问答系统 基于知识的问答系统建立大规模知识库,通过理解将用户的问题转化为对知识图谱的查询,提供用户所关心的问题答案。
编辑概念 右键单击概念图标,选择“编辑”。 或双击概念图标。 左侧弹出概念编辑框。 在概念编辑框中,按表1编辑“概念名称”、“Icon”和“属性”。 图2 编辑概念 表1 编辑概念 参数 说明 概念名称 概念名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。 Icon
在KG服务管理控制台创建本体后,您可以预览描述本体信息的结构图。 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在本体列表中,单击操作栏的“预览”,即可预览本体信息的结构图。 图1 预览本体 单击编辑框的概念节点或关系曲线。 左侧弹出信息框,可查看对应的名称、属性和属性类型等信息。
表格配置模式 表格配置模式指通过填写基础数据映射前后的相关字段,完成知识映射配置。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 已完成信息抽取配置,详情请参见配置信息抽取。 操作步骤
把本体导出至OBS文件夹中。 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在本体列表中,单击操作栏的“导出”,弹出对话框。 在对话框中选择OBS存储本体的路径: 在“OBS桶”文本框中选择导出本体的存储OBS桶。 在“导出文件名”文本框中填写存储本体的文件名称。
在KG服务管理控制台创建抽取模型,详情请见创建模型。 操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。 在“版本管理”区域单击“创建新版本”。 弹出“创建新版本”对话框。 配置模型参数的参数值,输入新版本的描述内容。
在“知识映射”对话框,选择编辑方式为“表格配置模式”,填写知识映射的相关信息。 单击实体“Person”对应的图标。 填写实体“Person”映射前的抽取项:“人物”。 填写映射到实体“Person”的抽取项,如图9和表3所示。 图9 实体Person的抽取项 表3 实体Person的抽取项
通过配置数据源、配置本体、配置信息抽取、配置知识映射和、配置知识融合、配置图谱质检,构建适用于自身业务的知识图谱。构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中
通过配置数据源、配置本体、配置信息抽取、配置知识映射和、配置知识融合、配置图谱质检,构建适用于自身业务的知识图谱。构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中
在“知识映射”对话框,选择编辑方式为“表格配置模式”,填写知识映射的相关信息。 单击实体“Person”对应的图标。 填写实体“Person”映射前的抽取项:“人物”。 填写映射到实体“Person”的抽取项,如图14和表3所示。 图14 实体Person的抽取项 表3 实体Person的抽取项
配置图谱本体 在创建知识图谱时,首先您需要把已创建的本体导入至待创建的图谱中,用于组织待创建图谱的信息结构。 前提条件 已创建本体,具体创建方式见创建本体。 已创建图谱并选择图谱规格,请参见购买知识图谱。 已配置数据源,请参见配置数据源。 操作步骤 在普通配置构建图谱页面,单击“图谱本体”。
单击“创建”后自动返回数据标注页面。在标注作业列表中单击作业名称,进入作业标注详情页,默认显示“未标注”的文本列表。 单击“同步新数据”,快速将数据集中的数据添加到标注作业中。 按下文步骤标注文本数据集。 在“未标注”页签文本列表中,页面左侧罗列“标注对象列表”。在左侧列表中单击需标注的文本对象,在右
json。前者用来指定需要抽取的关系三元组类型,后者用来存放所有的标注数据。 schema.json一行一句json字符串,表示一种关系三元组类型:“predicate”表示谓词,“subject”表示主语类型,“object”表示宾语类型。例如: {"predicate": "出生地", "subject": "人物"
非结构化抽取 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 如果选择使用自己自定义模型,您需要在创建知识图谱之前,自定义用于信息抽取的模型,具体操作请见自定义信息抽取模型。 操作步骤
双击界面空白处,新建概念节点。 右键单击概念图标,选择“编辑”或双击概念图标,左侧弹出概念编辑框。 在概念编辑框中,按表1编辑“概念名称”、“Icon”和“属性”,单击“保存”。 图4 编辑概念 表1 编辑概念 参数 说明 推荐填写 概念名称 概念名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。
常见的问题类型及返回答案如下: 列表型问题 通过枚举方式列举出所有的答案实体及实体属性。 例如: Q:不止英雄的主演有哪些? A:列举所有主演名字。 谓词型问题 直接返回对应的实体信息。 例如: Q:卜发的出生日期是什么时候? A:人物卜发的出生日期。 复杂谓词型问题 直接返回列表式的对应实体信息。
基础知识 知识图谱 知识图谱是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系。知识图谱的基本单位是“实体(Entity)-关系(Relationship)-实体(Entity)”构成的三元组。例如社交网络图谱里,我们既可以有“人”的实体,也可以包含“公司”实体。 概念
KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。 表1 抽取函数说明表 抽取函数 函数说明 抽取函数示例
原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围 具体方式 操作指引 结构化抽取 基础数据格式为xlsx、csv、json格式 交互界面配置:通过