检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
南》。 与对象存储服务的关系 知识图谱服务使用对象存储服务(Object Storage Service,简称OBS)存储构建知识图谱的源数据,实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务控制台指南》。 父主题: 一般性问题
在发布数据集时,“版本格式”选择“Default”。 ModelArts发布的标注数据集是“.manifest”格式的文件,其中包含多行,每行是一个JSON格式的标注样例。 前提条件 准备训练数据并上传至OBS目录,详细步骤请参见准备训练数据,数据类型和要求请见训练数据类型介绍。
对于已经创建的图谱版本,支持导出图谱版本至OBS桶。导出的图谱可以通过“全量更新 > 图谱导入”进行恢复。 导出的图谱版本包含以下信息: csv文件夹:存放csv源数据文件 ontology.json:图谱本体配置文件 pipeline_config.json:流水线配置文件 操作步骤 登录KG服务管理控制台,默认进入“我的图谱”页面。
如果加密,请重新建一个不加密的OBS桶,即不要勾选“开启默认加密”。创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。 上传对象时不要勾选加密,OBS上传数据的详细操作请参见上传文件。 父主题: 创建图谱
南》。 与对象存储服务的关系 知识图谱服务使用对象存储服务(Object Storage Service,简称OBS)存储构建知识图谱的源数据,实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务控制台指南》。
此仅适用于抽取基础数据格式为txt文本的自然语言短句。 自定义模型流程 自定义信息抽取模型的流程如表1所示。 表1 自定义信息抽取模型流程 流程 说明 操作指引 准备训练数据 提前准备用于训练模型的数据。 准备训练数据 创建模型 基于您的训练数据(即已标注数据),您可以在KG服务中创建信息抽取模型。
见表1。 图3 创建流程图 表1 创建流程表 流程 方法 说明 详细指导 配置数据源 - 数据是知识图谱的基础。 基于已存储在OBS中的基础数据,您可以从OBS导入用于构建知识图谱的基础数据。 配置数据源 配置图谱本体 - 您可以选择已在控制台创建的本体,或者选择从OBS导入的本体,用于组织待创建图谱的信息结构。
pplication programming interface)管理方式。 管理控制台方式 KG服务提供了简洁易用的管理控制台,包含配置数据源、图谱本体、信息抽取、知识映射、知识融合、图谱质检等功能,您可以在管理控制台完成您的知识图谱创建与管理。 使用KG服务管理控制台,需先注
知识图谱管理 支持创建知识图谱流水线任务,生成知识图谱。 支持编辑知识图谱流水线任务信息,包括数据源选择、图谱本体配置、信息抽取配置、知识映射信息配置、知识融合信息配置、图谱质检配置。 支持增量数据,更新图谱。 支持图谱预览、图谱版本管理。 构建图谱流程 KG服务为用户提供了两种方式构
提交知识图谱服务相关工单时,如何选择问题所属的产品类型 知识图谱服务(Knowledge Graph,简称KG)为自然语言处理服务(Natural Language Processing Service ,简称NLP)的子服务,提交知识图谱服务相关工单时,单击“工单全部产品与服务分类”,选择产品类型为“自然语言处理
待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。
步骤4:配置数据源 在流水线构建页面,单击“数据源”,页面下方弹出数据源配置对话框,单击右侧按钮可以放大对话框。 图5 配置数据源 在“数据源配置”对话框,填写相关信息。 “选择数据格式”:此样例选择“短文本”。 “选择数据源文件”:单击,弹出“选择数据源文件”对话框,选择数据源存放在OBS的路径:
待创建图谱的名称。在选择图谱规格时已确定,无法更改。 选择数据格式 构建图谱的数据源格式,包括“CSV”、“XLSX”、“JSON”,详情请见数据格式要求。 选择数据源文件 选择数据源存放在OBS的路径。 单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”。 “OBS桶”:选择数据源文件存放的OBS桶。
配置图谱质检 图谱质检对流水线构建中的数据源、信息抽取、知识映射、知识融合提供质量检查,辅助用户定位构建中出现的问题。从知识的准确性、一致性、完整性、时效性、重复性五种维度出发,为用户提供通用且全面的评估,并输出质检报告,详见查看质检报告。 配置步骤 在普通配置构建图谱页面,单击
发布图谱版本 针对全量更新的图谱、增量更新的图谱、通过复制快速创建的图谱,您可以发布图谱版本。只有发布图谱版本后,才能查询图谱中的实体数据。 前提条件 已全量更新图谱或增量更新图谱。 发布图谱版本 登录KG服务管理控制台,默认进入“我的图谱”页面。 在“我的图谱”页面,单击图谱卡片,进入图谱详情页面。
千万边最多支撑1200万实体和1200万关系,数据量超过会被裁剪。 当前KG服务不支持在控制台直接购买,需要通过官网产品页服务咨询联系我们进行咨询购买。 高级版图谱 图谱规模为千万边,最多支撑1200万实体和1200万关系,数据量超过会被裁剪。 当前KG服务不支持在控制台直接购
千万边最多支撑1200万实体和1200万关系,数据量超过会被裁剪。 当前KG服务不支持在控制台直接购买,需要通过官网产品页服务咨询联系我们进行咨询购买。 高级版图谱 图谱规模为千万边,最多支撑1200万实体和1200万关系,数据量超过会被裁剪。 当前KG服务不支持在控制台直接购
label String 实体类型。 properties Map<String,Array<String>> 实体各个属性值,格式为字典数据结构,键为该实体属性名,值为字符串列表,为该实体属性值。 表7 pathItem 参数 参数类型 描述 id String 关系ID,格式
知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。 如图3所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。 图3 知识融合示例 图谱质检 图谱质检对流水线构建中的数据源、信息抽取、
自身的业务需求使用KG提供的一系列常用实践。 表1 常用最佳实践 实践 描述 结构化数据创建图谱 本实践指导使用结构化数据(XLSX、CSV、JSON格式的数据)创建图谱。以与电影有关的结构化数据为例,通过在控制台创建本体、完成信息抽取、知识映射、知识融合、图谱质检的配置,运行对