检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
出生日期 ${出生日期} url ${url} Film identifier ${url} 中文名 ${中文名} 票房 ${票房} 上映时间 ${上映时间} 导演 regexp_extract_all(${导演}, '\(\[link\]@.*?:(/film.*?)\)', 1) 主演
配置数据源 数据是知识图谱的基础。在创建知识图谱时,基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 提前准备好创建图谱的数据并上传至OBS,详情请参见准备图谱数据。 进入图谱创建页面 在“我
创建图谱简介 数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关
出生日期 ${出生日期} url ${url} Film identifier ${url} 中文名 ${中文名} 票房 ${票房} 上映时间 ${上映时间} 导演 regexp_extract_all(${导演}, '\(\[link\]@.*?:(/film.*?)\)', 1) 主演
出生日期 ${出生日期} url ${url} Film identifier ${url} 中文名 ${中文名} 票房 ${票房} 上映时间 ${上映时间} 导演 regexp_extract_all(${导演}, '\(\[link\]@.*?:(/film.*?)\)', 1) 主演
的 xx属性 月光宝盒的上映时间 xx实体属性 + 呢 上映时间呢 xx属性 是 xx值 的 xx实体类型 票房是10亿的电影 xx实体 的 xx关系(正向一跳关系) 月光宝盒的导演 xx实体 的 xx关系(正向一跳关系)+ 概念限制 月光宝盒的导演是哪个人物 xx实体 和 xx实体
准确率(Precision)是在被所有预测为正的样本中实际为正样本的概率。 :召回率(Recall)是在实际为正的样本中被预测为正样本的概率。 :F1值综合考虑准确率和召回率的影响,由两者计算而来,越接近1代表模型越好。 更新时间 版本的更新时间。 状态 版本的状态,包括“训练
的相似度均满足阈值,就可判断这两个实体实际上指代的是一个实体。 每组可添加多个判断融合的属性,最多添加9个。 “相似度函数” 判断属性相似度需要选择相似度函数,当前支持两种相似度函数,一种是“EditSim”(编辑距离),一种是“JaccardSim”(Jaccard距离)。 说明:
知识图谱的计费规格,一万条边、百万边、千万边具体指什么 知识图谱的数据存储在图数据库,图数据库基本数据类型包含点和边。 点代表实体。如交通网络中的车辆、通信网络中的站点、电商交易网络中的用户和商品、互联网中的网页等。 边代表关系。如社交网络中的好友关系、电商交易网络中用户评分和购
出生日期 ${出生日期} url ${url} Film identifier ${url} 中文名 ${中文名} 票房 ${票房} 上映时间 ${上映时间} 导演 regexp_extract_all(${导演}, '\(\[link\]@.*?:(/film.*?)\)', 1) 主演
见查看/修改本体。 基于已有图谱修改本体,是指在已有本体基础上新建一个新的本体。 基于已有图谱修改本体,不能修改已有属性的类型。 更新日志 可查看日志更新列表,包括“运行编号”、“事件类型”、“本体”、“状态”、“开始时间”、“结束时间”、“操作”。 父主题: 管理图谱版本
"value_function": "${票房}" }, { "key": "上映时间", "value_function": "${上映时间}" }, { "key": "导演",
什么是字段抽取函数 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在通过普通抽取方式进行信息抽取时,即用交互界面配置或用格式化编辑进行信息抽取时,需要配置字段抽取函数。配置
填写映射到实体“电影”的抽取项,如表1所示。 图3 实体电影知识映射 表1 实体电影的知识映射字段 属性/关系名称 抽取项 name 中文名 票房 票房 上映时间 上映时间 导演 导演 主演 主演 知识与实体人物的映射关系,如图4所示。 图4 实体人物的映射关系 在实体“人物”下方的“类型映射”区域填写映射前的实体类型字段“Person”。
ery 表1 路径参数 参数 是否必选 参数类型 描述 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。 请求参数
由于数据安全原因,本样例不提供具体的样例数据,仅提供样例数据要求,要求如下: 数据格式 数据格式为短文本txt格式,文件内容示例如下: 张三的生日是1990年1月1日,身高175cm,出生于北京。 李四,著名导演,毕业于电影学院,代表作有《电影1》、《电影2》。 ... ... 数据划分
准备图谱数据 数据是知识图谱的基础。在创建知识图谱时,需要提前将创建图谱的数据上传至OBS。 数据格式要求 XLSX文件 该类型为结构化数据输入格式。使用XLSX文件,即表格文件作为数据源时,文件必须为.xlsx格式,文件中每一个工作簿为一类数据,工作簿名为数据类型名。每个工作簿
入实体类型、抽取函数及抽取前后的数据字段,才能进行配置信息映射、配置知识融合等操作。 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构
定义三元组类型(schema) 标注数据 上传至OBS 准备待标注的数据 准备待标注的训练数据,并保存至本地。数据格式为短文本txt格式,文件内容示例如下: 张三的生日是1990年1月1日,身高175cm,出生于北京。 李四,著名导演,毕业于电影学院,代表作有《电影1》、《电影2》。 ... ... 定义三元组类型(schema)
什么是信息抽取 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围