-
故障恢复 - AI开发平台ModelArts
故障恢复 ModelArts全球基础设施围绕华为云区域和可用区构建。华为云区域提供多个在物理上独立且隔离的可用区,这些可用区通过延迟低、吞吐量高且冗余性高的网络连接在一起。利用可用区,您可以设计和操作在可用区之间无中断地自动实现故障转移的应用程序和数据库。与传统的单个或多个数据中
-
更新管理 - AI开发平台ModelArts
更新管理 ModelArts在线服务更新 对于已部署的推理服务,ModelArts支持通过更换AI应用的版本号,实现服务升级。 推理服务有三种升级模式:全量升级、滚动升级(扩实例)和滚动升级(缩实例)。了解三种升级模式的流程,请参见图1。 全量升级 需要额外的双倍的资源,先全量创建新版本实例,然后再下线旧版本实例。
-
修订记录 - AI开发平台ModelArts
修订记录 发布日期 修订记录 2024-01-18 新增案例: 使用自定义镜像创建的训练作业一直处于运行中 训练作业运行失败排查指导 调用API创建训练作业,训练作业异常 训练作业的监控内存指标持续升高直至作业失败 新增NCCL日志报错说明:训练作业运行失败,出现NCCL报错 2023-11-23
-
服务管理 - AI开发平台ModelArts
服务管理 服务管理概述 部署本地服务进行调试 部署在线服务 查询服务详情 推理服务测试 查询服务列表 查询服务对象列表 更新服务配置 查询服务监控信息 查询服务日志 删除服务
-
快速开始 - AI开发平台ModelArts
快速开始 ModelArts SDK目前仅支持在ModelArts开发环境Notebook和本地PC两种环境使用。 ModelArts SDK不支持在训练作业和在线服务中使用。 ModelArts SDK已经集成在ModelArts开发环境Notebook中,可以直接使用,无需进行Session鉴权。
-
训练管理 - AI开发平台ModelArts
训练管理 训练作业 资源和引擎规格接口
-
产品发布说明 - AI开发平台ModelArts
产品发布说明 昇腾云服务6.3.T061版本说明 昇腾云服务6.3.905版本说明 昇腾云服务6.3.T051版本说明 昇腾云服务6.3.904版本说明 昇腾云服务6.3.T041版本说明 ModelArts 6.5.0版本配套关系表
-
历史API - AI开发平台ModelArts
历史API 数据管理(旧版) 开发环境(旧版) 训练管理(旧版)
-
计费样例 - AI开发平台ModelArts
计费样例 计费场景一 某用户于2023/03/18 15:30:00使用一个按需计费的公共资源池进行训练,规格配置如下: 规格:CPU: 8 核 32GB (modelarts.vm.cpu.8ud) 计算节点个数:1个 用了一段时间后,于2023/03/20 10:30:00停
-
审计日志 - AI开发平台ModelArts
审计日志 支持云审计的关键操作 查看审计日志
-
智能标注 - AI开发平台ModelArts
智能标注 创建智能标注作业 难例确认
-
训练作业 - AI开发平台ModelArts
训练作业 OBS操作相关故障 云上迁移适配故障 硬盘限制故障 外网访问限制 权限问题 GPU相关问题 业务代码问题 预置算法运行故障 训练作业卡死 训练作业运行失败 专属资源池创建训练作业 训练作业性能问题 Ascend相关问题
-
自动学习 - AI开发平台ModelArts
自动学习 准备数据 模型训练 部署上线 模型发布
-
模型管理 - AI开发平台ModelArts
模型管理 模型调试 导入模型 查询模型列表 查询模型对象列表 查询模型详情 删除模型
-
文档导读 - AI开发平台ModelArts
文档导读 本文档指导您如何安装和配置开发环境、如何通过调用ModelArts SDK提供的接口函数进行二次开发。 章节 内容 SDK简介 简要介绍ModelArts SDK的概念。 快速开始 介绍如何使用ModelArts SDK进行二次开发。 (可选)本地安装ModelArts
-
计费相关 - AI开发平台ModelArts
ModelArts上传数据集收费吗? ModelArts标注完样本集后,如何保证退出后不再产生计费? ModelArts自动学习所创建项目一直在扣费,如何停止计费? 如果不再使用ModelArts,如何停止收费? 训练作业如何收费? 为什么项目删除完了,仍然还在计费? 欠费后,ModelArts的资源是否会被删除?
-
修订记录 - AI开发平台ModelArts
修订记录 发布日期 修订记录 2024-01-03 新增APP认证管理的接口:APP认证管理 2023-12-14 新增APP认证管理:APP认证管理 新增DevServer管理接口:DevServer 管理 2023-09-19 新增历史API,将数据管理(旧版)、开发环境(旧
-
工作空间管理 - AI开发平台ModelArts
工作空间管理 查询工作空间详情 修改工作空间 删除工作空间 查询工作空间配额 修改工作空间配额 查询工作空间列表 创建工作空间
-
弹性集群 - AI开发平台ModelArts
弹性集群 ModelArts资源池管理功能全面升级 创建资源池 查看资源池详情 扩缩容资源池 设置续费策略 调整到期策略 工作空间迁移 修改资源池作业类型 资源池驱动升级 修复Standard资源池故障节点 删除资源池 资源池异常处理 ModelArts网络 ModelArts节点
-
资源监控 - AI开发平台ModelArts
资源监控 概述 使用Grafana查看AOM中的监控指标 在AOM控制台查看ModelArts所有监控指标