检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
阶段 相关文档 1 上线图谱搜索、推荐功能 在预览图谱时,支持使用Gremlin语句查询实体,同时支持在预览图谱页面查看查询实体的记录。 公测 预览图谱 2020年08月 序号 功能名称 功能描述 阶段 相关文档 1 数据源支持结构化数据 在创建知识图谱时,可以使用csv、xlsx等结构化数据构建图谱。
知识图谱提供一站式知识图谱全生命周期管理服务,用户无需关注底层实现细节,通过专门设计的知识图谱构建流水线,可以可视化构建本体、自动化构建知识图谱,并且随时对图谱进行全量、增量更新,保证知识的可靠、时效性。 管理本体 本体简介 创建本体 管理模型 准备训练数据 创建模型 创建版本 发布版本 创建图谱 智能一键构建图谱
训练数据:80%数据用于训练信息抽取模型。 验证数据:20%数据用于验证信息抽取模型性能(即F1、P、R性能指标)。 训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。
管理图谱 如何全量更新图谱 如何查看图谱中的整个实体关系 如何增量更新图谱 图谱版本更新后,历史版本是否支持图谱预览
准备训练数据 在创建抽取模型时,需要您提前准备用于训练模型的数据并上传至OBS目录,数据格式为txt文本的自然语言短句。KG服务当前支持的数据类型请参见训练数据类型介绍。 准备数据流程如下: 准备待标注的数据 定义三元组类型(schema) 标注数据 上传至OBS 准备待标注的数据
训练数据:80%数据用于训练信息抽取模型。 验证数据:20%数据用于验证信息抽取模型性能(即F1、P、R性能指标)。 训练数据量 训练一个基本可用的模型,标注数据量总数需要大于模型版本配置中的“batch_size”,且需大于20*三元组类型数量。 训练一个效果较好的模型,建议提供2万条以上的短句数据作为训练数据。
/property-query 表1 路径参数 参数 是否必选 参数类型 描述 kg_id 是 String 知识图谱ID。在KG服务控制台“我的图谱”页面,单击图谱名称,进入图谱详情页左上角获取知识图谱ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID。
型、端到端的关系抽取模型,它对于标注数据量的要求非常低,平均每个关系仅需要200组左右标注数据即可训练出一个较好(实测F1值在0.7左右)的模型,平均每个关系标注数据在2000左右模型训练效果达到一个峰值(实测F1值在0.8左右),数据量越多,质量越好,效果会越好。 MRC-BM
单击“添加属性”可添加属性文本框,在文本框中填写属性的“名称”,选择“单值/多值”、“类型”、“操作”。 “名称”:属性名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。 “单值/多值”:选择当前属性是单值还是多值。 “类型”:选择属性的类型,“单值”可选类型有“single_string”
面配置和代码编辑。 在通过结构化抽取方式进行信息抽取时,即用交互界面配置或用代码编辑进行信息抽取时,需要配置引用字段的抽取函数。 KG服务支持的信息抽取函数如表1所示。其中,“字段”表示基础数据中的字段名,在抽取函数中引用字段时,使用格式为“${字段}”,例如抽取基础数据中属性“
已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 熟悉KG服务支持的信息抽取函数。 操作步骤 在普通配置构建图谱页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 在“信
已创建图谱并选择图谱规格,请参见购买知识图谱。 已创建并选择本体,详情请参见配置图谱本体。 已完成数据源配置,详情请参见配置数据源。 熟悉KG服务支持的信息抽取函数。 操作步骤 在普通配置构建图谱页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。 在“信
创建图谱简介 数据是知识图谱的基础,在知识图谱服务创建知识图谱时,需要从OBS导入用于构建知识图谱的基础数据。知识图谱服务支持的数据包括XLSX、CSV、JSON、多行单句文本格式,详情请见数据格式要求,其中多行单句文本格式的数据属于非结构化数据。 本章节提供一个与人物、电影有关
知识图谱功能说明 功能 说明 本体管理 支持创建本体。 支持查看、编辑本体信息。 支持导出本体。 模型管理 支持自定义信息抽取模型,利用模型进行信息抽取。 支持创建、发布信息抽取模型版本。 知识图谱管理 支持创建知识图谱流水线任务,生成知识图谱。 支持编辑知识图谱流水线任务信息,包括数
知识图谱无法运行,提示“错误的信息抽取函数”。 可能原因 流水线信息抽取配置有误。 解决方案 检查信息抽取函数和配置信息抽取时所填的参数。 知识图谱服务支持的信息抽取函数具体请参见信息抽取函数。配置信息抽取操作请参见配置信息抽取。 以创建一个有关于电影的知识图谱为例,抽取信息前后的实体信息如图
单击“新增属性”可添加属性文本框,在文本框中填写属性的“名称”,选择“单值/多值”、“类型”、“操作”。 名称:属性名称只能由大小写字母、数字、中文、下划线组成,长度为1-63位。 单值/多值:选择当前属性是单值还是多值。 类型:选择属性的类型,可选类型有“single_stri
指引请见表1。 “增量更新”页面入口与“创建知识图谱”页面入口不同,但是增量更新中的配置操作均与创建知识图谱操作相同。 增量更新不支持更新本体,仅支持预览本体。 图1 增量更新 表1 增量更新图谱操作 操作顺序 操作名称 操作指引 1 增加基础数据 配置数据源 2 更新信息抽取 配置信息抽取
limit(10) ,随机查看10条关系,则输入命令g.E().limit(10)。 使用Gremlin语句查询当前暂不支持TinkerPop3.4中原生支持的模糊搜索功能,例如startingWith、endingWith、containing等查询。 父主题: 预览查询知识图谱
知识图谱功能说明 功能 说明 本体管理 支持创建本体。 支持查看、编辑本体信息。 支持导出本体。 模型管理 支持自定义信息抽取模型,利用模型进行信息抽取。 支持创建、发布信息抽取模型版本。 知识图谱管理 支持创建知识图谱流水线任务,生成知识图谱。 支持编辑知识图谱流水线任务信息,包括数
知识图谱功能说明 功能 说明 本体管理 支持创建本体。 支持查看、编辑本体信息。 支持导出本体。 模型管理 支持自定义信息抽取模型,利用模型进行信息抽取。 支持创建、发布信息抽取模型版本。 知识图谱管理 支持创建知识图谱流水线任务,生成知识图谱。 支持编辑知识图谱流水线任务信息,包括数