检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。 图2 知识融合 表1 知识融合说明 融合过程 过程说明 初步筛选 知识融合需要初步筛选与融合标识符相似的实体数据。 判断属性相似度 初步筛选与融合标识符相似的数据后,需要配置相似
抽取时,可分为交互界面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如
如何上传基础数据至OBS 使用KG创建知识图谱时,首先需要将基础数据上传至华为云对象存储服务(OBS)桶中。您可以登录OBS管理控制台创建OBS桶,并在您创建的OBS桶中创建文件夹,创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。然后再进行数据的上传,OBS上传数据的详细操作请参见上传文件。
获取项目ID 从控制台获取项目ID 在调用接口的时候,部分URI中需要填入项目编号,所以需要先在管理控制台上获取到项目编号。 项目编号获取步骤如下: 注册并登录管理控制台。 单击用户名,在下拉列表中选择“我的凭证”。 在“我的凭证”页面的项目列表中查看项目ID。 图1 查看项目ID
ity_id}/adjacent-entities 表1 路径参数 参数 是否必选 参数类型 描述 entity_id 是 String 实体ID。 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。
获得操作API的权限。 Token可通过调用获取用户Token接口获取,调用本服务API需要project级别的Token,即调用获取用户Token接口时,请求body中auth.scope的取值需要选择project,如下所示。 获取用户Token接口请求构造如下,您可以从接口
人,因此需要对这两条数据进行融合。 图1 知识融合示例 知识融合过程请见图2,融合过程说明请见表1。 图2 知识融合 表1 知识融合说明 融合过程 过程说明 初步筛选 知识融合需要初步筛选与融合标识符相似的实体数据。 判断属性相似度 初步筛选与融合标识符相似的数据后,需要配置相似
支持图谱预览、图谱版本管理。 构建图谱流程 KG服务为用户提供了两种方式构建图谱,不同的方式所需要的功能不同。基于不同的图谱构建方式,梳理了使用KG服务的主要流程。 图2 构建图谱流程 表2 构建图谱流程说明 主任务 说明 详细指导 购买知识图谱&选择图谱规格 在创建知识图谱之前,需要购买图谱并选择图谱规格。
/v1/{project_id}/kg/kg-instances/{kg_id}/gremlin-query 表1 路径参数 参数 是否必选 参数类型 描述 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是
数据源存储的OBS路径不允许使用加密的OBS路径。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。 单击“下一步”。 自动生成本体结构,您也可以进行修改。
用户注册华为云时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用他们进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。
配置图谱质检 配置完后,单击右上角的“生成图谱”。 跳至“我的图谱”页面,等待“运行状态”变为“可用”,即图谱构建完成。您可以单击已构建的图谱卡片,进入图谱详情页面查看图谱详情。 后续操作 增量更新图谱后,如果存在被融合的实体,就需要进行融合验证,详情请见融合验证。 增量更新图谱后,您可以发
数据源存储的OBS路径不允许使用加密的OBS路径。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。 单击“下一步”。 自动生成本体结构,您也可以进行修改。
“公有库”页签下的“图谱本体组件”呈现的是KG服务预置的本体,如果有满足您需求的本体,您也可以直接拖拽使用。 可单击页面右下角的“编辑”,进入本体修改页面,修改后的本体将保存至“我的库”。 图1 图谱本体 图谱本体配置完成后,鼠标悬浮在图谱本体方框区域,显示清空图标,单击后可一键清空图谱本体配置。 后续操作
g-instances/{kg_id}/apps/kbqa/converse 表1 路径参数 参数 是否必选 参数类型 描述 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是
配置图谱质检 配置完后,单击右上角的“生成图谱”。 跳至“我的图谱”页面,等待“运行状态”变为“可用”,即图谱构建完成。您可以单击已构建的图谱卡片,进入图谱详情页面查看图谱详情。 后续操作 增量更新图谱后,如果存在被融合的实体,就需要进行融合验证,详情请见融合验证。 增量更新图谱后,您可以发
“数据集名称”:选择“RelationExtraction”。如果选不到,可以单击图标刷新后再选。 “添加标签集”:按表1添加实体标签和关系标签,实体标签需要添加表1中的“subject_type”和“object_type”,关系标签需要添加表1中的“predicate”,如图5和图6所示。 “启用团队
选择“默认抽取”开关。 图标说明开关处于开启状态。开启后,在每个数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。 图标说明开关处于关闭状态,需要自定义填写信息抽取项。 在“信息抽取”对话框中填写信息抽取项: 每个表/文件中的数据需要设置一个唯一标识符identifier(
例如以一个有关于电影的图谱数据为例,选择数据格式和数据源文件后,下方可预览基础数据。 图3 数据源配置 填写完信息后,单击“保存”。 如果您待创建的图谱只需要一个数据源,那么您已完成数据源的配置。 如果您待创建的图谱需要输入多个数据源,请进入下一步。 单击“数据源”下方的“添加数
代码编辑”。 图1 信息抽取 选择“默认抽取”开关。 图标说明开关处于开启状态。开启后,在每个数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。 图标说明开关处于关闭状态,需要编辑json格式代码。 在“信息抽取”对话框下方编辑json格式代码。 在“代码编辑