搜索_华为云

标注任务管理 - AI开发平台ModelArts

标注任务管理创建标注任务查询数据集的标注任务列表查询标注任务详情父主题：数据管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理
Ascend相关问题 - AI开发平台ModelArts

Ascend相关问题 Cann软件与Ascend驱动版本不匹配训练作业的日志出现detect failed（昇腾预检失败）父主题：训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
Standard开发环境 - AI开发平台ModelArts

Standard开发环境将Notebook的Conda环境迁移到SFS磁盘使用ModelArts VSCode插件调试训练ResNet50图像分类模型

 帮助中心 > AI开发平台ModelArts > 最佳实践
ModelArts Standard资源监控 - AI开发平台ModelArts

Standard资源监控概述在ModelArts控制台查看监控指标在AOM控制台查看ModelArts所有监控指标使用Grafana查看AOM中的监控指标

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
管理批量推理作业 - AI开发平台ModelArts

管理批量推理作业查看批量服务详情查看批量服务的事件管理批量服务生命周期修改批量服务配置父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练脚本存放目录说明不同模型推荐的参数与NPU卡数设置训练tokenizer文件说明父主题： Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）
查询模型runtime - AI开发平台ModelArts

状态码：200 表4 响应Body参数参数参数类型描述 count Integer 不分页的情况下符合查询条件的总数量。 total_count Integer 当前查询结果的数量，不设置offset、limit查询参数时，count与total相同。 engine_runtimes

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
Lite Cluster - AI开发平台ModelArts
Lite Cluster - AI开发平台ModelArts

Lite Cluster 资源池创建失败的原因与解决方法？ Cluster资源池节点故障如何定位特权池信息数据显示均为0%如何解决？重置节点后无法正常使用？

帮助中心 > AI开发平台ModelArts > 故障排除
制作自定义镜像用于ModelArts Standard - AI开发平台ModelArts

制作自定义镜像用于ModelArts Standard 自定义镜像使用场景 ModelArts支持的预置镜像列表制作自定义镜像用于创建Notebook 制作自定义镜像用于训练模型制作自定义镜像用于推理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
推理服务性能评测 - AI开发平台ModelArts

推理服务性能评测语言模型推理性能测试多模态模型推理性能测试获取模型推理的Profiling数据父主题：主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901）
资源管理 - AI开发平台ModelArts
资源管理 - AI开发平台ModelArts

资源管理查询OS的配置参数查询插件模板查询节点列表批量删除节点批量对节点功能上锁批量对节点功能解锁批量重启节点查询事件列表创建网络资源查询网络资源列表查询网络资源删除网络资源更新网络资源查询资源实时利用率创建资源池查询资源池列表查询资源池删除资源池

 帮助中心 > AI开发平台ModelArts > API参考
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

'feat_2:0', 'feat_3': 'feat_3:0'} 不做数据集切分操作。如果选择未切分的数据集，算法将做纯训练场景；父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
历史待下线案例 - AI开发平台ModelArts

历史待下线案例使用AI Gallery的订阅算法实现花卉识别使用ModelArts PyCharm插件调试训练ResNet50图像分类模型示例：从 0 到 1 制作自定义镜像并用于训练（PyTorch+CPU/GPU）示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU）

帮助中心 > AI开发平台ModelArts > 最佳实践
训练性能测试 - AI开发平台ModelArts

<master_addr> --num_nodes <nodes> --rank <rank> <cfgs_yaml_file>：性能测试配置的yaml文件地址，如代码目录中performance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
镜像保存时报错“there are processes in 'D' status, please check process status using 'ps -aux' and kill all the 'D' status processes”或“Buildimge - AI开发平台ModelArts

from daemon: Cannot pause container xxx”。原因分析执行镜像保存时，Notebook中存在状态为D的进程，会导致镜像保存失败。解决方案在Terminal里执行ps -aux命令检查进程。执行kill -9 <pid>命令将相关进程结束后，再次执行镜像保存即可。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 - AI开发平台ModelArts

无法再新建。如您有任何问题，可随时通过工单或者服务热线（4000-955-988或950808）与我们联系。常见问题下线镜像对现有用户的使用是否有影响？下线镜像对已有用户不影响，用户可以继续使用已有实例启动Notebook，但是需要注意删除实例后无法再新建实例。镜像下线后是否可以继续基于该镜像新建实例？

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
制作自定义镜像用于训练模型 - AI开发平台ModelArts

制作自定义镜像用于训练模型训练作业的自定义镜像制作流程使用预置镜像制作自定义镜像用于训练模型已有镜像迁移至ModelArts用于训练模型从0制作自定义镜像用于创建训练作业（Pytorch+Ascend）从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

timeout:939 callbacks suppressed 华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败裸金属服务器Euler

帮助中心 > AI开发平台ModelArts > 故障排除
同步Lite Server服务器状态 - AI开发平台ModelArts

登录ModelArts管理控制台。在左侧导航栏中，选择“AI专属资源池 > 弹性节点 Server”，进入“节点”列表页面。在弹性节点Server列表中，单击的“同步”，在弹出的确认对话框中，确认信息无误，然后单击“确定”，完成同步操作。图1 同步状态父主题： Lite Server资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
训练性能测试 - AI开发平台ModelArts

<master_addr> --num_nodes <nodes> --rank <rank> <cfgs_yaml_file>：性能测试配置的yaml文件地址，如代码目录中performance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具

总条数： 2560

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

标注任务管理 - AI开发平台ModelArts

Ascend相关问题 - AI开发平台ModelArts

Standard开发环境 - AI开发平台ModelArts

ModelArts Standard资源监控 - AI开发平台ModelArts

管理批量推理作业 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

Lite Cluster - AI开发平台ModelArts

制作自定义镜像用于ModelArts Standard - AI开发平台ModelArts

推理服务性能评测 - AI开发平台ModelArts

资源管理 - AI开发平台ModelArts

使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

历史待下线案例 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

镜像保存时报错“there are processes in 'D' status, please check process status using 'ps -aux' and kill all the 'D' status processes”或“Buildimge - AI开发平台ModelArts

【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 - AI开发平台ModelArts

制作自定义镜像用于训练模型 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

同步Lite Server服务器状态 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线