检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 实体类型字段 数据中标识该实体属于何种类型的字段。 当数据源的数据格式为“JSON”时,需要填写该字段。 单击“下一步”。 自动生成本体结构,您也可以进行修改。
”,“编辑方式”选择“交互界面”。 关闭“默认抽取”开关。 在“信息抽取”对话框中填写信息抽取项,按表1填写。 表1 信息抽取项示例 数据类别 抽取项名称 抽取函数 Person identifier ${url} 中文名 regexp_replace(${中文名}, '\(\[link\]@
从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取 配置实体类型和对应数据字段信息。 配置知识映射 配置映射前后的数据字段。 配置知识融合 配置知识融合的相关属性和相似函数。 配置图谱质检 配置图谱质检开关。
从OBS导入用于构建知识图谱的基础数据。 配置图谱本体 选择“我的库”中已创建的本体,或选择“公有库”中预置的本体。 配置信息抽取 配置实体类型和对应数据字段信息。 配置知识映射 配置映射前后的数据字段。 配置知识融合 配置知识融合的相关属性和相似函数。 配置图谱质检 配置图谱质检开关。
面,单击,进入“新建图谱”页面。 在“新建图谱”页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框。 单击“增加”,在“数据类别”中填写新的数据类别,“抽取项名称”自动填充“identifier”,在“抽取函数”文本框中填写实体唯一标识字段,并填写信息抽取的其他信息。 详细操作请参见配置信息抽取。
在KG服务管理控制台上自定义信息抽取模型是一种基于schema约束的中文信息抽取模型,即从自然语言文本中抽取三元组的模型,因此仅适用于抽取基础数据格式为txt文本的自然语言短句。 自定义模型流程 自定义信息抽取模型的流程如表1所示。 表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据
体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。 在知识图谱服务中,需要通过输入实体类型、抽取函数及抽取前后的数据字段,或创建信息抽取模型来配置信息抽取。 知识映射 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映
创建模型 创建新版本 发布版本 配置信息抽取项 信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。 通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取的配置。 配置信息抽取 配置知识映射 - 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系。
在“存储路径”文本框中选择导出本体的存储路径。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 图1 导出本体 单击“确定”,完成导出本体操作。 父主题: 管理本体
“存储路径”:选择提前准备的本体文件存放在OBS桶中的路径。 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。 图1 OBS导入本体 确认信息后,单击“确定”,跳转至“本体管理”页面。 您可以查看从OBS导入的本体,并通过“操作”栏
> 导出”。 图1 导出图谱 在图谱导出对话框中,选择导出的“OBS桶”和“存储路径”。所选的OBS桶需保证与KG服务在同一区域,桶的存储类别为“标准存储”。 图2 选择存储路径 单击“确定”。 等待图谱导出完成,在更新日志页签中,单击“查看导出结果”自动跳转至导出的OBS桶。 图3
在“信息抽取”对话框中,“抽取方式”选择“结构化抽取”,“编辑方式”选择“代码编辑”。 图1 信息抽取 选择“默认抽取”开关。 图标说明开关处于开启状态。开启后,在每个数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。 图标说明开关处于关闭状态,需要编辑json格式代码。 在“信息抽取”对话框下方编辑json格式代码。