搜索_华为云

资源管理 - AI开发平台ModelArts
资源管理 - AI开发平台ModelArts

资源管理查询OS的配置参数查询插件模板查询节点列表批量删除节点批量重启节点查询事件列表创建网络资源查询网络资源列表查询网络资源删除网络资源更新网络资源查询资源实时利用率创建资源池查询资源池列表，可通过标签、资源池状态筛选查询资源池列表查询资源池删除资源池

 帮助中心 > AI开发平台ModelArts > API参考
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

py并将此脚本作为“启动文件”。这样启动的作业将会持续运行60分钟。您可通过Cloud Shell进入容器进行调试。 sleep.py示例： import os os.system('sleep 60m') 图4 预置框架启动方式如果训练作业使用的是自定义镜像在创建训练作业时，“创建方式”选择“自

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
编写训练代码 - AI开发平台ModelArts

如何安装C++的依赖库？训练作业中如何判断文件夹是否复制完毕？如何在训练中加载部分训练好的参数？训练作业的启动文件如何获取训练作业中的参数？训练作业中使用os.system('cd xxx')无法进入相应的文件夹？训练作业如何调用shell脚本，是否可以执行.sh文件？训练代码中，如何获取依赖文件所在的路径？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案

 帮助中心 > AI开发平台ModelArts > 故障排除
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案问题现象裸金属服务器EulerOS 2.8系统下，使用yum update -y命令，导致软件NetworkManagre-config-server升级到高版本，出现SSH链接故障无法访问。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
精度问题诊断 - AI开发平台ModelArts

精度问题诊断逐个替换模型，检测有问题的模型该方式主要是通过模型替换，先定位出具体哪个模型引入的误差，进一步诊断具体的模型中哪个算子或者操作导致效果问题，模型替换原理如下图所示。通过设置开关选项（是否使用onnx模型），控制模型推理时，模型使用的是onnx模型或是mindir的模型。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
Lite Cluster使用流程 - AI开发平台ModelArts

Cluster节点默认会安装os-node-agent插件，用于对节点进行管理，例如：驱动升级：通过os-node-agent插件下载驱动文件并进行驱动版本升级、回退。故障检测：通过os-node-agent插件在系统内周期性巡检故障特征，及时发现节点故障。指标采集：通过os-node-a

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
使用CES监控Lite Server资源 - AI开发平台ModelArts

请检查NPU RoCE UDP端口配置情况影响NPU卡通信性能系统内核自动升级预警 KernelUpgradeWarning 重要系统内核自动升级预警，旧版本：%s，新版本：%s 系统内核升级可能导致配套AI软件异常，请检查系统更新日志，避免机器重启可能导致配套AI配套软件不可用 NPU环境相关命令检测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

_cuda_getDeviceCount() > 0 原因分析 nvidia-modprobe是一个Linux工具，用于在系统中加载NVIDIA驱动程序及其相关的内核模块。在Linux系统上安装NVIDIA显卡驱动后，需要通过“nvidia-modprobe”命令来加载相应的内核模块，以便让显卡驱动正常工作。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
与其他云服务的关系 - AI开发平台ModelArts

与其他云服务的关系图1 ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务产品文档》。与对象存储服务的关系

 帮助中心 > AI开发平台ModelArts > 产品介绍
【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版训练管理下线公告华为云ModelArts服务旧版训练管理在2023年6月30日 00:00(北京时间)正式退市。下线范围下线区域：华为云全部Region 下线影响正式下线后，用户将无法再使用旧版训练管理的功能，包括旧版训练作业、

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告华为云ModelArts服务模型转换在2024年4月30日 00:00(北京时间)正式下线。下线范围下线区域：华为云全部Region 下线影响正式下线后，用户将无法再使用模型转换的功能，包括创建和删除模型转换任务、查询模型转换任务列表和详情功能。

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
Lite Server高危操作一览表 - AI开发平台ModelArts

高：对于可能直接导致业务失败、数据丢失、系统不能维护、系统资源耗尽的高危操作。中：对于可能导致安全风险及可靠性降低的高危操作。低：高、中风险等级外的其他高危操作。表1 高危操作一览表操作对象操作名称风险描述风险等级应对措施操作系统升级/修改操作系统内核或者驱动。如果升级/修改操作系统内核或者

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
Standard模型训练 - AI开发平台ModelArts

ckpoint接续训练，保障需要长时间训练的模型的稳定性和可靠性，避免重头训练耗费的时间与计算成本支持训练数据使用SFS Turbo文件系统进行数据挂载，训练作业产生的中间和结果等数据可以直接高速写入到SFS Turbo缓存中，并可被下游业务环节继续读取并处理，结果数据可以异步

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
Notebook使用场景 - AI开发平台ModelArts

使用量较小时选择小存储，可以在创建完成后根据需要扩充EVS容量；使用动态挂载OBS将OBS对象存储模拟成本地文件系统；还可以在Notebook异常时查看实例的事件定位等，具体参见管理Notebook实例。 ModelArts CLI，集成在ModelArts开发环境Noteboo

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
初识Workflow - AI开发平台ModelArts

初识Workflow 父主题：图解ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > 图解ModelArts
计费模式 - AI开发平台ModelArts
计费模式 - AI开发平台ModelArts

计费模式 ModelArts计费模式概述包年/包月按需计费套餐包

 帮助中心 > AI开发平台ModelArts > 计费说明
计费FAQ - AI开发平台ModelArts
计费FAQ - AI开发平台ModelArts

计费FAQ 如何查看ModelArts中正在收费的作业？如何查看ModelArts消费详情？如果不再使用ModelArts，如何停止收费？ ModelArts上传数据集收费吗？ ModelArts标注完样本集后，如何保证退出后不再产生计费？ ModelArts自动学习所创建项目一直在扣费，如何停止计费？

帮助中心 > AI开发平台ModelArts > 计费说明
发布和管理AI Gallery镜像 - AI开发平台ModelArts

发布和管理AI Gallery镜像托管镜像到AI Gallery 发布镜像到AI Gallery 管理AI Gallery镜像父主题： AI Gallery（新版）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
AI Gallery（旧版） - AI开发平台ModelArts

AI Gallery（旧版） AI Gallery简介免费资产和商用资产入驻AI Gallery 我的Gallery介绍订阅使用发布分享参加活动合作伙伴需求广场

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）

总条数： 1123

上一页
1
2
3
4
5
...
57
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

资源管理 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

编写训练代码 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

精度问题诊断 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

Lite Server高危操作一览表 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

初识Workflow - AI开发平台ModelArts

计费模式 - AI开发平台ModelArts

计费FAQ - AI开发平台ModelArts

发布和管理AI Gallery镜像 - AI开发平台ModelArts

AI Gallery（旧版） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线