检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
知识图谱的计费规格,一万条边、百万边、千万边具体指什么 知识图谱的数据存储在图数据库,图数据库基本数据类型包含点和边。 点代表实体。如交通网络中的车辆、通信网络中的站点、电商交易网络中的用户和商品、互联网中的网页等。 边代表关系。如社交网络中的好友关系、电商交易网络中用户评分和购
的函数字段。 例如以一个有关于电影的图谱数据为例,选择数据格式和数据源文件后,下方可预览基础数据。 图3 数据源配置 填写完信息后,单击“保存”。 如果您待创建的图谱只需要一个数据源,那么您已完成数据源的配置。 如果您待创建的图谱需要输入多个数据源,请进入下一步。 单击“数据源”
抽取项名称 抽取信息后的属性字段。 抽取函数 抽取信息时所使用的引用字段的信息抽取函数,具体请见信息抽取函数。 确认所填写的信息后,单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 示例 以创建一个有关于电影的知识图谱
创建图谱简介 数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关
准备数据流程如下: 准备待标注的数据 定义三元组类型(schema) 标注数据 上传至OBS 准备待标注的数据 准备待标注的训练数据,并保存至本地。数据格式为短文本txt格式,文件内容示例如下: 张三的生日是1990年1月1日,身高175cm,出生于北京。 李四,著名导演,毕业
编辑关系 填写完信息,单击“保存”。 删除关系 右键单击关系曲线,选择“删除”,即可删除当前关系曲线。 选中关系曲线,使用快捷键“delete”也可删除当前关系曲线。 图8 删除关系 保存本体 本体的所有概念节点和关系曲线均编辑完成后,单击编辑界面右上角保存图标,或使用快捷键“ctrl
person_film”到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图12 图谱本体 步骤5:配置信息抽取
话框,单击右侧按钮可以放大对话框。 在左侧“公有库”页签,拖拽“图谱本体组件”到虚线框中,单击“保存”,完成本体选择。 可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图7 图谱本体 步骤6:配置信息抽取 本步骤以使用公有资产库模型组件为例,介绍信息抽取的配置操作。
编辑关系 填写完信息,单击“保存”。 删除关系 右键单击关系曲线,选择“删除”,即可删除当前关系曲线。 选中关系曲线,使用快捷键“delete”也可删除当前关系曲线。 图9 删除关系 保存本体 本体的所有概念节点和关系曲线均编辑完成后,单击编辑界面右上角保存图标,或使用快捷键“ctrl
person_film”到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图12 图谱本体 步骤6:配置信息抽取
person_film”到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“我的本体”页面创建或OBS导入的所有本体。 可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图12 图谱本体 步骤6:配置信息抽取
编辑关系 填写完信息,单击“保存”。 删除关系 右键单击关系曲线,选择“删除”,即可删除当前关系曲线。 选中关系曲线,使用快捷键“delete”也可删除当前关系曲线。 图9 删除关系 保存本体 本体的所有概念节点和关系曲线均编辑完成后,单击编辑界面右上角保存图标,或使用快捷键“ctrl
页面下方弹出图谱本体配置对话框,单击右侧按钮可以放大对话框。 选择左侧“我的库”页签,在“图谱本体组件”中拖拽合适的本体到虚线框中,单击“保存”,完成本体选择。 “我的库”页签下的“图谱本体组件”呈现的是“我的图谱资产库”中“本体管理”页面创建或OBS导入的所有本体。 “公有库”
出品公司 企业 人物 妻子 人物 人物 母亲 人物 人物 国籍 国家 影视作品 上映时间 Date 按上文要求准备待标注的训练数据和模型数据,并保存至本地,训练数据命名为“annotation.txt”,模型数据命名为“corpus.txt”。 登录OBS服务,创建桶和文件夹,用于存放数据集。
什么是知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。
数据。 单击“添加分组”,即可添加一组新的属性配置项。 单击“增加属性配置项”,即可在组内添加新的属性配置项。 每个实体配置完成后,单击“保存”。 表2 知识融合参数说明 配置参数 配置参数说明 “融合标识符” 知识融合需要初步筛选与融合标识符相似的实体数据。融合标识符即初步筛选
配置知识融合时,如何选择融合标识符和配置属性 知识融合 知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1
线构建进行评估,并生成质检报告,详见查看质检报告。 如果不需要进行图谱质检,则关闭“图谱质检”开关,单击“保存”。 如果需要进行图谱质检,则打开“图谱质检”开关,单击“保存”。
_type”、谓语“Predicate”、宾语“Object_type”,即可查看到可抽取的主语、谓语、宾语组合。 图2 抽取模型 单击“保存”,完成信息抽取。 如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。 后续操作 配置信息抽取后,进入创建图谱的下一步操作配置知识映射。
导出本体 针对在KG服务管理控制台创建的本体,您可以把本体导出至OBS文件夹中。 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在本体列表中,单击操作栏的“导出”,弹出对话框。 在对话框中选择OBS存储本体的路径: 在“OBS