检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过配置数据源、配置本体、配置信息抽取、配置知识映射和、配置知识融合、配置图谱质检,构建适用于自身业务的知识图谱。构建流程请参见图2和表2。详细的操作步骤请见普通配置构建图谱。 图2 流水线构建知识图谱 表2 创建流程表 流程 说明 配置数据源 从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中
“代码编辑”。 图1 信息抽取 选择“默认抽取”开关。 图标说明开关处于开启状态。开启后,在每个数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。 图标说明开关处于关闭状态,需要编辑json格式代码。 在“信息抽取”对话框下方编辑json格式代码。 在“代码编
OBS导入本体 通过OBS导入一个新的本体。 前提条件 将待导入的本体文件(json格式)上传至OBS中,详情请参见OBS添加桶和OBS上传文件或文件夹。 从OBS导入 登录KG服务管理控制台,在左侧菜单栏中选择“我的图谱资产库 > 我的本体”,进入“本体管理”页面。 在“本体管
建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。 单击“下一步”。 自动生成本体结构,您也可以进行修改。 单击“下一步”。 进入流水线配置页面。
建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。 单击“下一步”。 自动生成本体结构,您也可以进行修改。 单击“下一步”。 进入流水线配置页面。
构建WorkSpace”。 进入普通配置构建图谱页面。 图2 智能构建图谱 按照流水线依次进行配置,详细的操作指引请见表1。 图3 创建流程图 表1 创建流程表 流程 方法 说明 详细指导 配置数据源 - 数据是知识图谱的基础。 基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。
信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。 表1 配置方式说明 配置方式 适用范围 具体方式 操作指引 结构化抽取 基础数据格式为xlsx、csv、json格式 交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。
从当前图谱所对应的本体所包含的概念节点中,选择一个作为新增数据的实体类型。 “属性” 根据选择的实体类型,填写该实体的属性值。其属性字段是在创建当前图谱所对应的本体时所编辑的属性字段。 例如在创建本体结构时,概念节点“film”的属性包括“box_office”、“release_time”,因此
选择“完全匹配”,输入“实体名称”,按回车进入图谱预览页面,预览该实体的知识图谱。 选择“模糊匹配”,输入实体名称部分字段,按回车进入图谱预览页面,预览实体名称含该字段的所有实体的知识图谱。 举例:某电影相关图谱,输入某一具体的电影名称,按回车进入图谱预览页面,预览该电影的知识图谱。
填写实体“电影”的属性配置项信息。 可添加多组属性配置项,每组属性配置项可添加多个判断融合的属性配置。至少存在一组属性配置项,组内所有判断融合的属性相似度均大于相似度阈值时,即可融合这两条数据。 本样例只需添加一个属性配置分组,一组里填写两个属性配置项信息,如图4所示。 单击“添加分组”,即可添加一组新的属性配置项。
样式。 属性 编辑当前概念的属性。所有概念都默认有一个属性为“name”,且默认属性类型为“single_string”。 添加属性 单击“添加属性”可添加属性文本框,在文本框中填写属性的“名称”,选择“单值/多值”、“类型”、“操作”。 “名称”:属性名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。
在“用户组”界面中,单击“创建用户组”。 输入“用户组名称”。 单击“确定”。 返回用户组列表,用户组列表中显示新创建的用户组。 在用户组列表中,单击新建用户组“开发人员组”,右侧的“权限配置”。 在用户组权限页签中,单击列表左上方的“配置权限”。 选择权限的作用范围。此处如选择区域级项目,则还需要在下拉框中选择需要授权的区域。
“数据集名称”:选择“RelationExtraction”。如果选不到,可以单击图标刷新后再选。 “添加标签集”:按表1添加实体标签和关系标签,实体标签需要添加表1中的“subject_type”和“object_type”,关系标签需要添加表1中的“predicate”,如图5和图6所示。 “启用团队标注”:
系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在知识图谱服务中,需要通过输入实体类型、抽取函数及抽取前后的数据字段,或创建信息抽取模型来配置信息抽取。 知识映射 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图2所示。
样式。 属性 编辑当前概念的属性。所有概念都默认有一个属性为“name”,且默认属性类型为“single_string”。 添加属性 单击“添加属性”可添加属性文本框,在文本框中填写属性的“名称”,选择“单值/多值”、“类型”、“操作”。 “名称”:属性名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。
询关联实体、进行KBQA会话、实体链接以及知识搜索、推荐功能。 API文档 API概览 执行知识图谱查询命令 查询实体详情 过滤查询实体列表 查询关联实体 进行KBQA会话 实体链接 知识搜索 知识推荐 02 使用 知识图谱提供一站式知识图谱全生命周期管理服务,用户无需关注底层实
用户项目ID。获取方法请参见获取项目ID。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 command 是 String 需要执行的gremlin查询语句,只能执行与查询功能相关的语句,不能执行修改图谱相关功能的语句。 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型
样式。 属性 编辑当前概念的属性。所有概念都默认有一个属性为“name”,且默认属性类型为“single_string”。 添加属性 单击“添加属性”可添加属性文本框,在文本框中填写属性的“名称”,选择“单值/多值”、“类型”、“操作”。 “名称”:属性名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。
数据是知识图谱的基础。在创建知识图谱时,需要提前将创建图谱的数据上传至OBS。 数据格式要求 XLSX文件 该类型为结构化数据输入格式。使用XLSX文件,即表格文件作为数据源时,文件必须为.xlsx格式,文件中每一个工作簿为一类数据,工作簿名为数据类型名。每个工作簿中,第一行为数据头,从第二行开始
KG服务提供接口请参见表1,您可以使用知识图谱数据面管理功能。 表1 知识图谱数据面接口 API 说明 执行知识图谱查询命令 根据图谱ID执行知识图谱查询命令。 查询实体详情 根据图谱ID和实体ID查询实体详情,包括实体的ID、类型、属性及属性值。 过滤查询实体列表 根据图谱ID,过