搜索_华为云

Lite Cluster资源开通 - AI开发平台ModelArts

当“可用区”选择“指定可用区”时，实例数量会根据可用区的数据自动计算，此处无须再次设置。说明：单次创建时，实例数建议不大于30，否则可能触发限流导致创建失败。部分区域的部分规格支持整柜购买，此时实例数会显示为“数量*整柜”，购买的实例总数为两者的乘积。整柜购买可实现不同任务间的物理隔离，避免通信冲突，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

数据行数小于window超参值时，日志中有报错信息：ERROR: data is shorter than windows 。处理方法增加预测数据行数大于训练作业window超参值。重建训练作业，修改window超参值。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

om格式的模型转换能力，在ModelArts中逐步增加.mindir格式的支持能力。下线模型转换后是否有替代功能？您可以通过链接下载ATC模型转换工具，按照指导，在线下转换成.om格式模型。 ModelArts中是否还会增加模型转换的能力？ ModelArts开发环境中在贵阳

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
在ModelArts的Notebook中使用VS Code调试代码无法进入源码怎么办？ - AI开发平台ModelArts

a debug configuration中选择Python File，其他语言操作类似。如下图所示：步骤三：编辑launch.json，增加justMyCode": false配置，如下所示。 { "version": "0.2.0",

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
手动续费 - AI开发平台ModelArts
手动续费 - AI开发平台ModelArts

如果您持有多台到期日不同的专属资源池，可以将到期日统一设置到一个日期，便于日常管理和续费。图2展示了用户将两个不同时间到期的资源，同时续费一个月，并设置“统一到期日”后的效果对比。图2 统一到期日更多关于统一到期日的规则请参见如何设置统一到期日。父主题：续费

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
创建训练任务，显示创建失败 - AI开发平台ModelArts

e拼成seq_len长度进行训练，因此原数据条数多不意味着处理后samples多。问题影响训练失败或者训练结果与预期不符。处理方法增加数据集数量。父主题： Studio

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
数据处理场景介绍 - AI开发平台ModelArts

度。数据增强：数据扩增通过简单的数据扩增例如缩放、裁剪、变换、合成等操作直接或间接的方式增加数据量。数据生成应用相关深度学习模型，通过对原数据集进行学习，训练生成新的数据集的方式增加数据量。数据域迁移应用相关深度学习模型，通过对原域和目标域数据集进行学习，训练生成原域向目标域迁移的数据。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

erLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE（VS Code）开发模型。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
SFT全参微调训练 - AI开发平台ModelArts

最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。 Step2 配置环境变量单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。表1 需要填写的环境变量环境变量示例值参数说明 GPUS_PER_NODE

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
在ModelArts中导入模型对于镜像大小有什么限制？ - AI开发平台ModelArts

50G，专属资源池容器引擎空间的默认为50G，专属资源池容器引擎空间可在创建资源池时自定义设置，设置专属资源池容器引擎空间不会造成额外费用增加。如果使用的是OBS导入或者训练导入，则包含基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和。如果使用的是自定义镜像导入，

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
发布Workflow到AI Gallery - AI开发平台ModelArts

", title="资产名称")基于指定的Workflow资产，发布新的版本，版本号自动增加；如果Workflow包含gallery的算法，则自动将依赖的算法资产发布新版本，版本号也自动增加。 Workflow资产白名单设置：在资产第一次发布时，可以通过release_to_g

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
附录：微调训练常见问题 - AI开发平台ModelArts

将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepsp

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
如何关闭Mox的warmup - AI开发平台ModelArts

Tensorflow分布式有多种执行模式，mox会通过4次执行50 step记录执行时间，选择执行时间最少的模型。处理方法创建训练作业时，在“运行参数”中增加参数“variable_update=parameter_server”来关闭Mox的warmup。父主题： MoXing

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
yaml配置文件参数配置说明 - AI开发平台ModelArts

用于指定预处理数据的工作线程数。随着线程数的增加，预处理的速度也会提高，但也会增加内存的使用。 per_device_train_batch_size 1 必须修改，指定每个设备的训练批次大小。 gradient_accumulation_steps 8 指定梯度累积的步数,这可以增加批次大小而不增加内存消耗。 output_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

开始测试使用的最小数据：取值范围[1, 1024]，单位可选为“B”、“KB”、“MB”、“GB”“TB”。日志上传路径：AI诊断日志上传路径。数据增加方式：当前支持乘法方式。乘法系数：数值范围[2, 100]。超过时间：数值范围[150, 3600]。 NCCL Test节点名称列表

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

如果没有用户组，也可以创建一个新的用户组，并通过“用户组管理”功能添加用户，并配置授权。如果指定的子用户没有在用户组中，也可以通过“用户组管理”功能增加用户。在用户的委托授权中同步增加此策略，避免在租户面通过委托token突破限制。在统一身份认证服务页面的左侧导航中选择委托，找到该用户组在ModelAr

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
执行训练任务（历史版本） - AI开发平台ModelArts

b <exp_name>：实验名称，具体可以设置的值参考<cfgs_yaml_file> Step2 配置数据输入和输出单击“增加训练输入”和“增加训练输出”，用于配置训练作业开始时需要输入数据的路径和训练结束后输出数据的路径。输入指定的目录在训练开始时，平台会自动将指定的OBS路径下的文件copy到容器内

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
修改训练作业优先级 - AI开发平台ModelArts

此时，该用户组下的所有用户均有权限通过Cloud Shell登录运行中的训练作业容器。如果没有用户组，也可以创建一个新的用户组，并通过“用户组管理”功能添加用户，并配置授权。如果指定的子用户没有在用户组中，也可以通过“用户组管理”功能增加用户。父主题：管理模型训练作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

Triton框架迁移操作步骤 TFServing框架迁移操作步骤增加用户ma-user。基于原生"tensorflow/serving:2.8.0"镜像构建，镜像中100的用户组默认已存在，Dockerfile中执行如下命令增加用户ma-user。 RUN useradd -d /home/ma-user

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
附录：训练常见问题 - AI开发平台ModelArts

将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepsp

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）

总条数： 1117

上一页
1
...
4
5
6
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Lite Cluster资源开通 - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

在ModelArts的Notebook中使用VS Code调试代码无法进入源码怎么办？ - AI开发平台ModelArts

手动续费 - AI开发平台ModelArts

创建训练任务，显示创建失败 - AI开发平台ModelArts

数据处理场景介绍 - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

在ModelArts中导入模型对于镜像大小有什么限制？ - AI开发平台ModelArts

发布Workflow到AI Gallery - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

修改训练作业优先级 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线