检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
知识图谱的计费规格,一万条边、百万边、千万边具体指什么 知识图谱的数据存储在图数据库,图数据库基本数据类型包含点和边。 点代表实体。如交通网络中的车辆、通信网络中的站点、电商交易网络中的用户和商品、互联网中的网页等。 边代表关系。如社交网络中的好友关系、电商交易网络中用户评分和购买行为、论文
表格配置模式 表格配置模式指通过填写基础数据映射前后的相关字段,完成知识映射配置。 前提条件 已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 已完成信息抽取配置,详情请参见配置信息抽取。 操作步骤
图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。 代码配置模式:通过编辑json格式代码,完成知识映射配置。具体步骤请见代码配置模式。 进行知识映射时,表格配置模式、代码配置模式可以相互切换。
过滤查询实体列表 功能介绍 根据图谱ID,过滤查看满足指定条件的实体列表,列表信息包括实体ID、实体类型、实体属性及其属性值。 URI POST /v1/{project_id}/kg/kg-instances/{kg_id}/entities/property-query 表1 路径参数
增加信息抽取项:单击“增加”,即可增加一项抽取信息类型。 删除信息抽取项:单击待删除的信息抽取项操作栏的“删除”,即可删除信息抽取项。 按表1填写“数据类别”,“抽取项名称”和“抽取函数”。 表1 信息抽取项属性说明 属性 说明 数据类别 基础数据中描述实体类型的字段。 抽取项名称 抽取信息后的属性字段。
选择布局 功能区操作 创建本体界面右上角的功能区,可基于当前本体进行一系列操作。 图10 功能区 表2 功能区操作 图标 说明 保存当前界面的概念节点和关系曲线。 清空界面,即清空当前界面的概念节点和关系曲线。 导出当前界面的概念节点和关系曲线至OBS。导出前需要提前创建好OBS桶,详情请见OBS添加桶。
选择布局 功能区操作 创建本体界面右上角的功能区,可基于当前本体进行一系列操作。 图11 功能区 表2 功能区操作 图标 说明 保存当前界面的概念节点和关系曲线。 清空界面,即清空当前界面的概念节点和关系曲线。 导出当前界面的概念节点和关系曲线至OBS。导出前需要提前创建好OBS桶,详情请见OBS添加桶。
可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图1 图谱本体 图谱本体配置完成后,鼠标悬浮在图谱本体方框区域,显示清空图标,单击后可一键清空图谱本体配置。 后续操作 选择图谱本体后,进入下一步操作配置信息抽取。
选择布局 功能区操作 创建本体界面右上角的功能区,可基于当前本体进行一系列操作。 图11 功能区 表2 功能区操作 图标 说明 保存当前界面的概念节点和关系曲线。 清空界面,即清空当前界面的概念节点和关系曲线。 导出当前界面的概念节点和关系曲线至OBS。导出前需要提前创建好OBS桶,详情请见OBS添加桶。
原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围 具体方式 操作指引 结构化抽取 基础数据格式为xlsx、csv、json格式 交互界面配置:通过
原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 配置方式 信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围 具体方式 操作指引 结构化抽取 基础数据格式为xlsx、csv、json格式 交互界面配置:通过
如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。 图2 知识融合 表1 知识融合说明 融合过程 过程说明 初步筛选 知识融合需要初步筛选与融合标识符相似的实体数据。 判断属性相似度 初步筛选与融合
KG服务提供接口请参见表1,您可以使用知识图谱数据面管理功能。 表1 知识图谱数据面接口 API 说明 执行知识图谱查询命令 根据图谱ID执行知识图谱查询命令。 查询实体详情 根据图谱ID和实体ID查询实体详情,包括实体的ID、类型、属性及属性值。 过滤查询实体列表 根据图谱ID,过
操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。 在版本管理列表中的“操作”栏,单击“删除”。 图1 删除版本 父主题: 管理版本
针对在KG服务管理控制台创建的本体,您可以删除本体以适应业务变化。 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在本体列表中,单击操作栏的“删除”。 单击“确定”,确认删除本体。 图1 删除本体 父主题: 管理本体
实体唯一标识字段 实体唯一标识字段指能识别每个数据的唯一字段,该字段在所有数据中具有唯一性,能唯一代表所对应的数据,类似于数据的“身份证”。 例如如下数据的唯一标识字段为“url” ,因为该字段能唯一代表该数据,因此在配置实体唯一标识字段时,“唯一标识字段”的文本框中填写“url”。 "{
pattern, int index) 提取出字段值中与正则表达式pattern匹配的子串。第三个参数index为可选参数,表示获取正则表达式匹配到的第index个捕获组。注意,index=0表示返回整个匹配的子串,index=1表示返回第一个捕获组。 regexp_extract_all(${info}
操作步骤 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击模型名称,进入模型详情页。 在版本管理列表中的“操作”栏,单击“发布”,待状态栏处于“已发布”状态,对应模型版本即可用于创建图谱过程中的信息抽取。 图1 发布版本
操作步骤如下: 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的模型”,进入模型管理页面。 在模型列表中,单击“模型名称”,进入模型详情页。 在版本管理列表中的“操作”栏,单击“修改”,弹出“修改版本”对话框。 图1 修改版本 在“修改版本”对话框中,填写“模型参数”
数据是知识图谱的基础。在创建知识图谱时,需要提前将创建图谱的数据上传至OBS。 数据格式要求 XLSX文件 该类型为结构化数据输入格式。使用XLSX文件,即表格文件作为数据源时,文件必须为.xlsx格式,文件中每一个工作簿为一类数据,工作簿名为数据类型名。每个工作簿中,第一行为数据头,从第二行开始