检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。 “存储路径”:选择数据源文件存放在OBS桶的文件路径。
构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。 “存储路径”:选择数据源文件存放在OBS桶的文件路径。
构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。 “存储路径”:选择数据源文件存放在OBS桶的文件路径。
创建图谱简介 数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关
创建抽取模型、创建并发布模型版本,用于创建知识图谱过程中的信息抽取。 在KG服务管理控制台上自定义信息抽取模型是一种基于schema约束的中文信息抽取模型,即从自然语言文本中抽取三元组的模型,因此仅适用于抽取基础数据格式为txt文本的自然语言短句。 自定义模型流程 自定义信息抽取模型的流程如表1所示。
"Person", "中文名": "康时", "国籍": "中国", "职业": "演员", "出生日期": "1985年3月3日", "url": "/film.kg.huawei.com/康时/165882308"} {"entity_type": "Person", "中文名": "戴奇"
) 返回字段1,字段2, ...中第一个不为空的字段 coalesce(${name},${名字}, ${中文名} ...) "name":" ", "名字":" ", "中文名”:"小明” “小明” parse_array(字段) 尝试将字段值解析为一个列表 parse_array(${list})
) 返回字段1,字段2, ...中第一个不为空的字段 coalesce(${name},${名字}, ${中文名} ...) "name":" ", "名字":" ", "中文名”:"小明” “小明” parse_array(字段) 尝试将字段值解析为一个列表 parse_array(${list})
准备训练数据 在创建抽取模型时,需要您提前准备用于训练模型的数据并上传至OBS目录,数据格式为txt文本的自然语言短句。KG服务当前支持的数据类型请参见训练数据类型介绍。 准备数据流程如下: 准备待标注的数据 定义三元组类型(schema) 标注数据 上传至OBS 准备待标注的数据
数据结构 公共响应参数 公共请求参数
云容器引擎-成长地图 | 华为云 知识图谱 知识图谱服务(Knowledge Graph,简称KG)提供一站式知识图谱全生命周期管理服务,包括本体可视化构建、自动化图谱流水线构建,以及图谱问答、搜索、推理等图谱应用能力,企业可以灵活掌控图谱配置,适合复杂多变的业务场景。 图说KG
请求消息体 请求消息体通常以结构化格式发出,与请求消息头中Content-type对应,传递除请求消息头之外的内容。如果请求消息体中参数支持中文,则中文字符必须为UTF-8编码。 每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE
如何上传基础数据至OBS 使用KG创建知识图谱时,首先需要将基础数据上传至华为云对象存储服务(OBS)桶中。您可以登录OBS管理控制台创建OBS桶,并在您创建的OBS桶中创建文件夹,创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。然后再进行数据的上传,OBS上传数据的详细操作请参见上传文件。
单击,在创建图谱页面按表2填写信息。 图1 服务选型 表2 服务选型参数说明 参数 说明 “图谱名称” 待创建图谱的名称,名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。 “图谱规格” 待创建图谱的规格大小。当前仅支持在控制台选择“体验版 一万边”,如果根据业务需要,选择标准版
单击,在创建图谱页面按表2填写信息。 图1 服务选型 表2 服务选型参数说明 参数 说明 “图谱名称” 待创建图谱的名称,名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。 “图谱规格” 待创建图谱的规格大小。当前仅支持在控制台选择“体验版 一万边”,如果根据业务需要,选择标准版
用户项目ID。获取方法请参见获取项目ID。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 query 是 String 用户的提问内容,中文英文及中英文标点符号,长度限制为1-50个字符。 session_id 否 String KBQA会话ID。如不携带或为过期、无效ID,则自动创建新的会话并返回会话ID。
配置完流水线的图谱,如何修改数据 已通过流水线配置完成构建的知识图谱,如果想要修改数据,可通过全量更新或增量更新图谱的方式,更新图谱。 全量更新图谱 针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。 增量更新图谱 针对已经创建的知识图谱,您可以增量更新图
属性融合依据的是哪一步的数据来配置的 属性融合依据的是您图谱里现有的实体和您创建图谱或更新图谱时新加入的实体,如果是首次创建图谱,那就没有现有实体。 在创建知识图谱时,当您配置知识映射后,您需要配置知识融合,设置知识融合判断属性及相似度函数参数,完成新知识图谱的创建。 实体需要融
公共响应参数 表1 公共响应消息头 名称 描述 Content-Length 响应消息体的字节长度,单位为Byte。 Date 系统响应的时间。 Content-type 发送的实体的MIME类型。 父主题: 数据结构
公共请求参数 表1 公共请求消息头 名称 描述 是否必选 示例 Content-type 发送的实体的MIME类型。 是 application/json Content-Length 请求body长度,单位为Byte。 POST/PUT请求为可选, GET不包含 3495 X-Auth-Token