知识图谱 KG-准备训练数据:定义三元组类型(schema)
定义三元组类型(schema)
为了训练自定义的信息抽取模型,需要定义该抽取模型能够抽取的三元组类型,并在训练数据中进行标注。
三元组是 知识图谱 构建的基本元组,三元组借鉴了语言学中主谓宾结构,语言学中一句话由主语(subject)、谓语(predicate)、宾语(object)组成,自然语言中的知识也可以建模为三个元素构成的组合格式,如“中国的首都是北京”这句话中,就有“中国-首都-北京”这样的三元组。
为了将三元组分类,我们定义三元组的类型由主语类型(subject type)、谓语(predicate)类型、宾语类型(object type),如上述三元组“中国-首都-北京”的类型是“国家-首都-城市”。通常我们将这些三元组类型组成的集合称为模型的schema。
- 华为云ModelArts_ModelArts开发_AI全流程开发
- ModelArts数据管理_数据管理功能简介_数据集管理
- ModelArts模型训练_模型训练简介_如何训练模型
- GaussDB数据库怎么转换类型_GaussDB安装_高斯数据库转换类型
- ModelArts模型训练_创建训练作业_如何创建训练作业
- GaussDB数据库自定义函数_GaussDB 华为_高斯数据库自定义函数
- GaussDB数据库如何定义变量_GaussDB怎么样_高斯数据库如何定义变量
- ModelArts推理部署_模型_AI应用来源-华为云
- 华为GaussDB自定义函数_GaussDB教程_华为高斯数据库自定义函数
- 文档数据库服务DDS实例类型_MongoDB实例类型_华为云