搜索_华为云

如何切分ModelArts数据集？ - AI开发平台ModelArts

如何切分ModelArts数据集？在发布数据集时，仅“图像分类”、“物体检测”、“文本分类”和“声音分类”类型数据集支持进行数据切分功能。一般默认不启用该功能。启用后，需设置对应的训练验证比例。输入“训练集比例”，数值只能是0~1区间内的数。设置好“训练集比例”后，“验证集

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

报错“BrokenPipeError: [Errno xx] Broken pipe”。原因分析出现该问题的可能原因如下：在大规模分布式作业上，每个节点都在复制同一个桶的文件，导致OBS桶限流。 OBS Client连接数过多，进程/线程之间的轮询，导致一个OBS Clie

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
下线公告 - AI开发平台ModelArts
下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告【下线公告】华为云ModelArts算法套件下线公告【下线公告】华为云ModelArts服务旧版训练管理下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告
管理训练容器环境变量 - AI开发平台ModelArts

管理训练容器环境变量什么是环境变量本章节展示了训练容器环境中预置的环境变量，方便用户查看，主要包括以下类型。路径相关环境变量分布式训练作业环境变量 NCCL（Nvidia Collective multi-GPU Communication Library）环境变量 OBS环境变量

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
认证证书 - AI开发平台ModelArts
认证证书 - AI开发平台ModelArts

认证证书合规证书华为云服务及平台通过了多项国内外权威机构（ISO/SOC/PCI等）的安全合规认证，用户可自行申请下载合规资质证书。图1 合规证书下载资源中心华为云还提供以下资源来帮助用户满足合规性要求，具体请查看资源中心。图2 资源中心销售许可证&软件著作权证书

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
Standard模型训练 - AI开发平台ModelArts

在ModelArts训练得到的模型欠拟合怎么办？在ModelArts中训练好后的模型如何获取？在ModelArts上如何获得RANK_TABLE_FILE用于分布式训练？在ModelArts上训练模型如何配置输入输出数据？在ModelArts上如何提升训练效率并减少与OBS的交互？在ModelA

帮助中心 > AI开发平台ModelArts > 常见问题
约束与限制 - AI开发平台ModelArts

业优先级。公共资源池和旧版专属资源池均不支持设置训练作业优先级。仅支持PyTorch和MindSpore框架的分布式训练和调测，如果MindSpore要进行多机分布式训练调试，则每台机器上都必须有8张卡。使用自定义镜像创建训练作业时，镜像大小推荐15GB以内，最大不要超过资源

 帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

部署在线服务时，您可以增加“实例数”。如果实例数设置为1，表示后台的计算模式是单机模式；如果实例数设置大于1，表示后台的计算模式为分布式的。您可以根据实际需求进行选择。推理速度与模型复杂度强相关，您可以尝试优化模型提高预测速度。 ModelArts中提供了模型版本管理的功能，方便溯源和模型反复调优。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
训练作业调测 - AI开发平台ModelArts

训练作业调测使用SDK调测单机训练作业使用SDK调测多机分布式训练作业父主题：训练作业

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

ts中，创建为AI应用，进行统一管理。 1、如果您是在ModelArts中训练得到的模型，可直接从训练中导入模型。 2、如果您在本地或其他平台训练得到模型，可先将模型上传至OBS，再从OBS中导入模型。从OBS导入元模型（手动配置）从训练中选择元模型使用自定义镜像创建AI应用

 帮助中心 > AI开发平台ModelArts > 功能总览
业务代码问题 - AI开发平台ModelArts

'NoneType' object has no attribute 'dtype'” 日志提示“No module name 'unidecode'” 分布式Tensorflow无法使用“tf.variable” MXNet创建kvstore时程序被阻塞，无报错日志出现ECC错误，导致训练作业失败

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
终止训练作业 - AI开发平台ModelArts

String 训练作业选择的自定义镜像地址，地址从swr服务获取。 install_sys_packages Boolean 是否需要安装训练平台指定的 moxing 版本。true为需要。只有填写了engine_name，engine_version，image_url参数时支持该设置。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
终止训练作业 - AI开发平台ModelArts

终止训练作业终止训练作业，只可终止创建中、等待中、运行中的作业。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。方式一：根据指定的job_id终止。 from modelarts.session

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
ModelArts入门指引 - AI开发平台ModelArts

lab使用Standard Notebook实例进行AI开发。如果您有自己的算法，想改造适配后迁移到ModelArts Standard平台上进行训练和推理，您可以参考使用自定义算法构建模型（手写数字识别）。更多入门实践，请参考《ModelArts入门实践》章节。如果您有其他

 帮助中心 > AI开发平台ModelArts > 快速入门
如何关闭Mox的warmup - AI开发平台ModelArts

定的问题，这是使用warm up的原因。等到训练过程基本稳定之后就可以使用原先设定的初始学习率进行训练。原因分析 Tensorflow分布式有多种执行模式，mox会通过4次执行50 step记录执行时间，选择执行时间最少的模型。处理方法创建训练作业时，在“运行参数”中增加参

 帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
开发环境（旧版） - AI开发平台ModelArts

开发环境（旧版）创建开发环境实例查询开发环境实例列表查询开发环境实例详情更新开发环境实例信息删除开发环境实例管理开发环境实例父主题：历史API

帮助中心 > AI开发平台ModelArts > API参考 > 历史API
OOM导致训练作业失败 - AI开发平台ModelArts

OOM导致训练作业失败问题现象因为OOM导致的训练作业失败，会有如下几种现象。错误码返回137，如下图所示。 Modelarts Service Log Trainina end with return code: 137 Modelarts Service Log]handle

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
查询训练作业列表 - AI开发平台ModelArts

查询训练作业列表示例代码在ModelArts Notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。 from modelarts.session import Session from modelarts.estimatorV2

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
ModelArts中常用概念 - AI开发平台ModelArts

Cluster使用的都是专属资源池。 MoXing MoXing是ModelArts自研的组件，是一种轻型的分布式框架，构建于TensorFlow、PyTorch、MXNet、MindSpore等深度学习引擎之上，使得这些计算引擎分布式性能更高，同时易用性更好。MoXing包含很多组件，其中MoXing Fra

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
使用MaaS调优模型 - AI开发平台ModelArts

规格选择规格，规格中描述了服务器类型、型号等信息，仅显示模型支持的资源。计算节点个数当计算节点个数大于1，将启动多节点分布式训练。详细信息，请参见分布式训练功能介绍。更多选项永久保存日志选择是否打开“永久保存日志”开关。开关关闭（默认关闭）：表示不永久保存日志，则任务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）

总条数： 2653

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何切分ModelArts数据集？ - AI开发平台ModelArts

OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

下线公告 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

认证证书 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

ModelArts在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

训练作业调测 - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

业务代码问题 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

ModelArts入门指引 - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

开发环境（旧版） - AI开发平台ModelArts

OOM导致训练作业失败 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线