搜索_华为云

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

Shell界面提示如下。图1 Cloud Shell界面当作业处于非运行状态或权限不足时会导致无法使用Cloud Shell，请根据提示定位原因即可。图2 报错提示部分用户登录Cloud Shell界面时，可能会出现路径显示异常情况，此时在Cloud Shell中单击回车键即可恢复正常。图3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
无法导入模块 - AI开发平台ModelArts

无法导入模块问题现象 ModelArts训练作业导入模块时日志报错： Traceback (most recent call last):File "project_dir/main.py", line 1, in <module>from module_dir import module_file

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

Turbo的VPC网段的安全组是否被限制了。在所选专属资源池中新建一个未挂载的SFS Turbo的训练作业，当训练作业处于“运行中”时，通过Cloud Shell功能登录训练作业worker-0实例，使用curl {sfs-turbo-endpoint}:{port}命令检查port是否正常打开，SFS

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
在ModelArts的Notebook中如何在代码中打印GPU使用信息？ - AI开发平台ModelArts

在ModelArts的Notebook中如何在代码中打印GPU使用信息？用户可通过shell命令或python命令查询GPU使用信息。使用shell命令执行nvidia-smi命令。依赖CUDA nvcc watch -n 1 nvidia-smi 执行gpustat命令。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
ma-cli auto-completion自动补全命令 - AI开发平台ModelArts

this message and exit. # 默认显示Bash Shell自动补全命令 $ ma-cli auto-completion Tips: please paste following shell command to your terminal to activate

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告华为云计划于2024/12/06 00:00（北京时间）将AI开发平台ModelArts自动学习模块的文本分类功能正式下线。下线范围下线Region：华为云全部Region。下线影响 ModelArts

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
服务部署失败，报错No Module named XXX - AI开发平台ModelArts

Module named XXX 原因分析 No Module named XXX，表示模型中没有导入对应依赖模块。处理方法依赖模块没有导入，需要您在模型推理代码中导入缺失依赖模块。例如您的模型是Pytorch框架，部署为在线服务时出现告警：ModuleNotFoundError:

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

env。 # shell conda config --append envs_dirs /home/ma-user/work/envs/user_conda/ 查看现有的conda虚拟环境，此时新的虚拟环境已经能够正常显示，可以直接通过名称进行虚拟环境的切换。 # shell conda

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
使用Windows下生成的文本文件时报错找不到路径？ - AI开发平台ModelArts

的换行格式不同，Windows下是CRLF，而Linux下是LF。解决方法可以在Notebook中转换文件格式为Linux格式。 shell语言： dos2unix 文件名父主题：代码运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
GPU日志收集上传 - AI开发平台ModelArts

gen_collect_gpu_log_shell(self): collect_gpu_log_shell = "nvidia-bug-report.sh" return collect_gpu_log_shell def collect_gpu_log(self):

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
NPU日志收集上传 - AI开发平台ModelArts

is_300_iduo: return collect_npu_log_shell return collect_npu_log_shell + hccn_tool_log_shell def collect_npu_log(self):

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
单模型性能测试工具Mindspore lite benchmark - AI开发平台ModelArts

析，并针对性地做一些调优操作。您可以直接使用benchmark命令测试mindir模型性能，用来对比调优前后性能是否有所提升。 # shell cd /home_host/work benchmark --modelFile=diffusers/scripts/mindir_models/text_encoder

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
Standard模型训练 - AI开发平台ModelArts

提供训练作业的事件信息（训练作业生命周期中的关键事件点）、训练日志（训练作业运行过程和异常信息）、资源监控（资源使用率数据）、Cloud Shell（登录训练容器的工具）等能力，方便用户更清楚的了解训练作业运行过程，并在遇到任务异常时更加准确的排查定位问题父主题： Standard功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

设置DEBUG日志。设置MindSpore日志环境变量。 # shell export GLOG_v=0 # 0-DEBUG、1-INFO、2-WARNING、3-ERROR 设置CANN日志环境变量。 # shell export ASCEND_GLOBAL_LOG_LEVEL=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
InternVL2&2.5系列模型基于Lite Server适配PyTorch NPU训练指导（6.5.901) - AI开发平台ModelArts

ternVL/internvl_chat/shell/internvl2.0/2nd_finetune/internvl*.sh vim ${container_work_dir}/InternVL/internvl_chat/shell/internvl2.5/2nd_finetune/internvl*

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

在SFS中将文件设置归属为ma-user。 chown -R ma-user:ma-group YOLOX 执行以下命令，去除Shell脚本的\r字符。 cd YOLOX sed -i 's/\r//' run.sh Shell脚本在Windows系统编写时，每行结尾是\r\n，而在Linux系统中行每行结尾是\n，

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
单模型性能调优AOE - AI开发平台ModelArts

warning、3-error。 # shell export ASCEND_GLOBAL_LOG_LEVEL=1 export ASCEND_SLOG_PRINT_TO_STDOUT=1 模型转换时指定AOE调优配置文件。 # shell # 模型转换时指定AOE调优配置文件并将调优日志输出到aoe_unet

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
管理模型训练作业 - AI开发平台ModelArts

查看训练作业详情查看训练作业资源占用情况查看模型评估结果查看训练作业事件查看训练作业日志修改训练作业优先级使用Cloud Shell调试生产训练作业复制、停止或删除训练作业管理训练容器环境变量查看训练作业标签查看训练作业监控指标父主题：使用ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
InternVL2基于LIte Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

5ad09b3eb9b2a7d9a24cca727fa58bb775/shells/* InternVL/internvl_chat/shell/internvl2.0/2nd_finetune/ 步骤六：增加适配代码表3 添加优化代码模型使用方法 internVL2-40B

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
上传算法至SFS - AI开发平台ModelArts

ma-user:ma-group Swin-Transformer 执行以下命令，去除Shell脚本的\r字符。 cd Swin-Transformer sed -i 's/\r//' run.sh Shell脚本在Windows系统编写时，每行结尾是\r\n，而在Linux系统中行每行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡

总条数： 202

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

无法导入模块 - AI开发平台ModelArts

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

在ModelArts的Notebook中如何在代码中打印GPU使用信息？ - AI开发平台ModelArts

ma-cli auto-completion自动补全命令 - AI开发平台ModelArts

【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 - AI开发平台ModelArts

服务部署失败，报错No Module named XXX - AI开发平台ModelArts

将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

使用Windows下生成的文本文件时报错找不到路径？ - AI开发平台ModelArts

GPU日志收集上传 - AI开发平台ModelArts

NPU日志收集上传 - AI开发平台ModelArts

单模型性能测试工具Mindspore lite benchmark - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

InternVL2&2.5系列模型基于Lite Server适配PyTorch NPU训练指导（6.5.901) - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

单模型性能调优AOE - AI开发平台ModelArts

管理模型训练作业 - AI开发平台ModelArts

InternVL2基于LIte Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线