检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
怎样配置实体唯一标识字段 实体唯一标识字段 实体唯一标识字段指能识别每个数据的唯一字段,该字段在所有数据中具有唯一性,能唯一代表所对应的数据,类似于数据的“身份证”。 例如如下数据的唯一标识字段为“url” ,因为该字段能唯一代表该数据,因此在配置实体唯一标识字段时,“唯一标识字段”的文本框中填写“url”。
字段抽取函数后,KG服务会根据所配置的字段抽取函数进行信息抽取,即从原始数据中抽取结构化的信息。更多详情请见配置信息抽取。 字段抽取函数说明 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础
修改本体信息,新建一个新的本体。 此操作和编辑本体存在区别。编辑本体是在已有本体基础上修改本体信息,新的本体信息会覆盖原有本体信息。而本章节所介绍的修改本体操作是基于某一个图谱版本使用的本体来修改本体信息,快速新建一个新的本体;同时会基于新的本体和当前图谱版本的数据生成一个新的图谱版本。
代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“name”的字段,在抽取函数中引用字段的格式为“trim(${name})”。
在版本管理列表中的“操作”栏,单击“修改”,弹出“修改版本”对话框。 图1 修改版本 在“修改版本”对话框中,填写“模型参数”的参数值和“描述”,如图2所示,鼠标移至可查看参数含义和推荐值。 图2 修改版本 单击“确定”,完成模型版本的修改。 父主题: 管理版本
配置完流水线的图谱,如何修改数据 已通过流水线配置完成构建的知识图谱,如果想要修改数据,可通过全量更新或增量更新图谱的方式,更新图谱。 全量更新图谱 针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。 增量更新图谱 针对已经创建的知识图谱,您可以增量更新图
选择“完全匹配”,输入“实体名称”,按回车进入图谱预览页面,预览该实体的知识图谱。 选择“模糊匹配”,输入实体名称部分字段,按回车进入图谱预览页面,预览实体名称含该字段的所有实体的知识图谱。 举例:输入实体名称“任霞”,按回车进入图谱预览页面,预览实体“任霞”的知识图谱。 单击右侧功
设置抽取映射前后的相关字段。 基本概念 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图1所示。 图1 实体电影的知识映射关系 配置方式 表格配置模式:通过填写基础数据映射前后的相关字段,完成知识映射配置。具体步骤请见表格配置模式。
创建图谱 为什么选择图谱规格时无法选中 如何创建知识图谱 什么是信息抽取 什么是字段抽取函数 什么是知识映射 什么是知识融合 怎样配置实体唯一标识字段 配置知识融合时,如何选择融合标识符和配置属性 属性融合依据的是哪一步的数据来配置的 配置信息抽取后,为什么查询不到实体数据 为何
KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。 单击“下一步”。 查看自动生成的本体结构,您也可以对本体进行修改。 单击“下一步”。 进入图谱流水线配置页面,无需手动配置,已自动配置好。
实体电影的知识映射关系 在实体“电影”下方的“类型映射”区域填写映射前的实体类型字段“Film”。 填写映射到实体“电影”的抽取项,如表1所示。 图3 实体电影知识映射 表1 实体电影的知识映射字段 属性/关系名称 抽取项 name 中文名 票房 票房 上映时间 上映时间 导演 导演
配置信息抽取简介 在创建知识图谱时,当您选择本体后,您需要配置信息抽取,输入实体类型、抽取函数及抽取前后的数据字段,才能进行配置信息映射、配置知识融合等操作。 基本概念 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。
编辑本体操作如下: 修改本体名称 新建概念 编辑概念 复制概念 删除概念 新建关系 编辑关系 删除关系 保存本体 选择本体布局 功能区操作 修改本体名称 在界面左上角的本体名称右侧单击,在“修改本体”对话框中修改已创建的“本体名称”和“本体描述”,修改完成后单击“确定”。 图1 修改本体名称
需要执行的gremlin查询语句,只能执行与查询功能相关的语句,不能执行修改图谱相关功能的语句。 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 data GremlinQueryRespData object 查询结果。请求失败时,字段为空。 表4 GremlinQueryRespData
S桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。 单击“下一步”。 自动生成本体结构,您也可以进行修改。 单击“下一步”。 进入流水线配置页面。 单击“运行”。 跳至图
S桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。 单击“下一步”。 自动生成本体结构,您也可以进行修改。 单击“下一步”。 进入流水线配置页面。 单击“运行”。 跳至图
在“交互界面”页签填写信息抽取前后的相关字段时,可单击“代码编辑”,切换至“代码编辑”页签,查看json代码。 图1 信息抽取 选择“默认抽取”开关。 图标说明开关处于开启状态。开启后,在每个数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。 图标说明开关处于关闭状态,需要自定义填写信息抽取项。
1) url ${url} 示例中字段抽取函数主要有三类,示例如下: ${职业} 直接引用“职业”字段的值,不做任何操作。 regexp_replace(${国籍}, '\(\[link\]@.*?:(/film.*?)\)', '') 将“国籍”字段中符合正则模式的“\(\[link\]@
“为OBS桶授权”:如果OBS桶未授权,请勾选“确认授权”。 选择完成后,单击“确定”。 “实体类型字段”:当数据格式选择“JSON”时,在“实体类型字段”文本框中填写基础数据中描述实体类型的函数字段。 例如以一个有关于电影的图谱数据为例,选择数据格式和数据源文件后,下方可预览基础数据。 图3
“代码编辑”。 图1 信息抽取 选择“默认抽取”开关。 图标说明开关处于开启状态。开启后,在每个数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。 图标说明开关处于关闭状态,需要编辑json格式代码。 在“信息抽取”对话框下方编辑json格式代码。 在“代码编