检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在创建知识图谱之前,您需要创建图谱的本体,用于组织知识图谱信息结构。 基本概念 实体 实体是有可区别性且独立存在的某种事物。例如某一具体的电影(或人物或关系),如电影“霸王别姬”,可称作实体。 概念 概念指是抽象的、普遍的想法,是充当指明实体、事件或关系的范畴或类的实体。例如本体如图1所示,
参数类型 描述 error_code String 错误码 error_msg String 错误信息 请求示例 根据不止英雄的主演卜发推荐一部电影,推荐算法总的游走步数为200000 https://nlp-ext.cn-north-4.myhuaweicloud.com/v1/16
Array<String>> 实体各个属性值,格式为字典数据结构,键为该实体属性名,值为字符串列表,为该实体属性值。 请求示例 过滤查询名称为一条牧羊犬的电影 https://nlp-ext.cn-north-4.myhuaweicloud.com/v1/1604d8170cd84440a812
数据格式为短文本txt格式,文件内容示例如下: 张三的生日是1990年1月1日,身高175cm,出生于北京。 李四,著名导演,毕业于电影学院,代表作有《电影1》、《电影2》。 ... ... 数据划分 训练数据:80%数据用于训练信息抽取模型。 验证数据:20%数据用于验证信息抽取模型性能(即F1、P、R性能指标)。
元素名称:默认显示配置基本信息中选择的概念名称。 同义词:概念的同义词,比如概念“电影”的同义词可配置为“影片”、“片子”。 权重:匹配问答与配置元素的近似度时,该元素所占比例。例如问答“不止英雄影片的主演是谁”相似度计算时,本体“电影”所占比例大小。 实体实例权重:匹配问答与配置元素的近似度时,该
概念限制 沈振导演了什么电影 xx实体 的 xx关系 的 xx关系(正向二跳关系) 沈振导演的电影的主演是谁 上一个实体 的 xx属性 它的上映日期 上一个实体 的 xx关系(正向) 他主演的电影 上一个实体 的 xx关系 的 xx关系(正向二跳关系) 她导演的电影的主演 上一个实体 和
"label_map_configs": { "Film": "电影", "Person": "人物" }, "property_map_configs": [ { "label": "电影", "source_keys": [
单击实体“电影”对应的图标。 填写实体“电影”映射前的抽取项:“Film”。 填写映射到实体“电影”的抽取项,如图15和表4所示。 图15 实体电影的抽取项 表4 实体电影的抽取项 属性/关系名称 抽取项 name 中文名 票房 票房 上映时间 上映时间 电影:主演:人物 主演
单击实体“电影”对应的图标。 填写实体“电影”映射前的抽取项:“Film”。 填写映射到实体“电影”的抽取项,如图15和表4所示。 图15 实体电影的抽取项 表4 实体电影的抽取项 属性/关系名称 抽取项 name 中文名 票房 票房 上映时间 上映时间 电影:主演:人物 主演
本实践指导使用非结构化数据(多行单句文本文件)创建图谱。以与人物、电影有关的非结构化数据为例,通过在控制台进行数据标注、模型训练,构建一个人物、电影有关的信息抽取模型,在自定义抽取模型的基础上去创建图谱。 使用公有资产库中的图谱流水线套件构建图谱 本实践提供一个与电影有关的非结构化数据样例,以便用户快速熟悉
系,填写相关信息。 知识与实体电影的映射关系,如图2所示。 图2 实体电影的知识映射关系 在实体“电影”下方的“类型映射”区域填写映射前的实体类型字段“Film”。 填写映射到实体“电影”的抽取项,如表1所示。 图3 实体电影知识映射 表1 实体电影的知识映射字段 属性/关系名称
对话。 例如问答模板“XX电影评分多少”,增加追问模板“请问您说的哪部电影?”,定位具体实体实例并反馈答案。 也可设置推荐问、兜底、无法回答等话术。 例如问答模板“请推荐好看的电影”,增加追问模板“推荐电影如下:”,答案会反馈“推荐电影如下:电影1、电影2...”。 配置问答模板(代码编辑)
"不止英雄", "score" : 1, "id" : "6751625866271911141", "label" : "电影", "properties" : { "票房" : "19.50亿" } }, { "name"
元素链接简介 通过配置元素链接,即配置图谱中概念以及概念属性、概念间的关系的同义词和权重,对用户输入的文本进行语义解析,识别出其中与图谱相关联的多种类型的元素。元素链接包括本体链接、实体链接、属性值链接,以及其他关键词链接等。 父主题: 配置元素链接
后的相关字段。 基本概念 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。
1所示,“电影”、“人物”以及两者之间的关系“主演”、“导演”均可称作概念。 本体 本体是某个领域中抽象概念的集合,能够描述某个范围内一切事物的共有特征以及事物间的关系。例如图1可称作一个本体。 实体 实体是知识图谱三元组的元素之一,指某种具体的事物。例如某一具体的电影(人物或关系),可称作实体。
检查信息抽取函数和配置信息抽取时所填的参数。 知识图谱服务支持的信息抽取函数具体请参见信息抽取函数。配置信息抽取操作请参见配置信息抽取。 以创建一个有关于电影的知识图谱为例,抽取信息前后的实体信息如图1所示,展示如何在创建图谱时配置信息抽取。 图1 信息抽取 在“创建图谱”页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框。
括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关的非结构化数据自定义信息抽取模型并使用自定义抽取模型创建知识图谱的流程,帮助您快速熟悉知识图谱自定义信息抽取模型创建过程和使用非结构化数据创建图谱的过程。步骤如下:
使用自定义抽取模型创建图谱 本章节以有关于人物和电影的非结构化数据为例,提供一个使用自定义的信息抽取模型创建知识图谱的流程,帮助您快速熟悉使用非结构化数据和自定义信息抽取模型创建图谱的过程。 首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。然后在控制台上创建信息抽取模型和知识图谱,步骤如下:
短文本txt格式,文件内容示例如下: 张三的生日是1990年1月1日,身高175cm,出生于北京。 李四,著名导演,毕业于电影学院,代表作有《电影1》、《电影2》。 ... ... 定义三元组类型(schema) 为了训练自定义的信息抽取模型,需要定义该抽取模型能够抽取的三元组类型,并在训练数据中进行标注。