搜索_华为云

在Notebook中如何查看GPU使用情况 - AI开发平台ModelArts

在Notebook中如何查看GPU使用情况创建Notebook时，当您选择的类型为GPU时，查看GPU使用情况具体操作如下：登录ModelArts管理控制台，选择“开发空间>Notebook”。在Notebook列表中，单击目标Notebook“操作”列的“打开”，进入“Jupyter”开发页面。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
如何查看训练作业资源占用情况？ - AI开发平台ModelArts

如何查看训练作业资源占用情况？在ModelArts管理控制台，选择“模型训练>训练作业”，进入训练作业列表页面。在训练作业列表中，单击目标作业名称，查看该作业的详情。您可以在“资源占用情况”页签查看到如下指标信息。 CPU：CPU使用率（cpuUsage）百分比（Percent）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 查看作业详情
开发环境提示空间不足，如何解决？ - AI开发平台ModelArts

开发环境提示空间不足，如何解决？当提示空间不足时，推荐使用EVS类型的Notebook实例。参考如何在Notebook中上传下载OBS文件？操作指导，针对原有的Notebook，首先将代码和数据上传至OBS桶中。然后创建一个EVS类型的Notebook，将此OBS中的文件下载

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
Ascend上如何查看实时性能指标？ - AI开发平台ModelArts

Ascend上如何查看实时性能指标？ Ascend芯片上查看实时性能指标：npu-smi info，类似GPU的nvidia-smi。父主题：更多功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？部署在线服务时，您可以选择性能更好的“计算节点规格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“计算节点个数”。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。您可以根据实际需求进行选择。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
MoXing如何访问文件夹并使用get - AI开发平台ModelArts

MoXing如何访问文件夹并使用get_size读取文件夹大小？问题现象使用MoXing无法访问文件夹。使用MoXing的“get_size”读取文件夹大小，显示为0。原因分析使用MoXing访问文件夹，需添加参数：“recursive=True”，默认为False。处理方法

 帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
如何查询自定义镜像的cuda和cudnn版本？ - AI开发平台ModelArts

如何查询自定义镜像的cuda和cudnn版本？查询cuda版本： cat /usr/local/cuda/version.txt 查询cudnn版本： cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ ModelArts提供AI诊断功能，用户可以通过NCCl Test，测试节点GPU状态，并且测试多个节点间的通信速度。操作步骤单击资源池名称，进入资源池详情。单击左侧“AI组件管理 > AI诊断”。单击“诊断”，选择“日志上传路径”和NCCL

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
Notebook无法执行代码，如何处理？ - AI开发平台ModelArts

Notebook无法执行代码，如何处理？当Notebook出现无法执行时，您可以根据如下几种情况判断并处理。如果只是Cell的执行过程卡死或执行时间过长，如图1中的第2个和第3个Cell，导致第4个Cell无法执行，但整个Notebook页面还有反应，其他Cell也还可以单击

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
ModelArts标注完样本集后，如何保证退出后不再产生计费？ - AI开发平台ModelArts

ModelArts标注完样本集后，如何保证退出后不再产生计费？标注样本集本身不计费，数据集存储在OBS中，收取OBS的费用。建议您前往OBS控制台，删除存储的数据和OBS桶，即可停止收费。父主题：计费相关

 帮助中心 > AI开发平台ModelArts > 常见问题 > 计费相关
训练代码中，如何获取依赖文件所在的路径？ - AI开发平台ModelArts

训练代码中，如何获取依赖文件所在的路径？由于用户本地开发的代码需要上传至ModelArts后台，训练代码中涉及到依赖文件的路径时，用户设置有误的场景较多。因此推荐通用的解决方案：使用os接口得到依赖文件的绝对路径，避免报错。以下示例展示如何通过os接口获得其他文件夹下的依赖文件路径。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

所有承载ModelArts服务的主机部署了主机安全防护产品。包括不限于华为自研HSS或计算安全平台CSP。 ModelArts服务部署了漏洞扫描服务并自行进行例行扫描，能快速发现漏洞并能及时修复。 ModelArts服务通过统一的安全管控平台对云上资源进行安全运维。 ModelArts服务部署了态势感知服务

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
示例：从 0 到 1 制作自定义镜像并用于训练（Pytorch+CPU/GPU） - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（Pytorch+CPU/GPU）本章节介绍如何从0到1制作镜像，并使用该镜像在ModelArts平台上进行训练。镜像中使用的AI引擎是PyTorch，训练使用的资源是CPU或GPU。本实践教程仅适用于新版训练作业。场景描述本示例使用Linux

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？问题现象启动服务失败，报错：资源不足，服务调度失败。（Schedule failed due to insufficient resources. Retry later.或ModelArts.3976：No resources

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？ - AI开发平台ModelArts

moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？问题现象使用MoXing训练模型，“global_step”放在Adam名称范围下，而非MoXing代码中没有Adam名称范围，如图1所示。其中1为

 帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
开发环境提示空间不足，如何解决？ - AI开发平台ModelArts

开发环境提示空间不足，如何解决？当提示空间不足时，推荐使用EVS类型的Notebook实例。参考如何在Notebook中上传下载OBS文件？操作指导，针对原有的Notebook，首先将代码和数据上传至OBS桶中。然后创建一个EVS类型的Notebook，将此OBS中的文件下载

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
在Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

在Notebook中，如何使用昇腾多卡进行调试？昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
提示“上传的AK/SK不可用”，如何解决？ - AI开发平台ModelArts

否，请执行步骤3。如能访问OBS，单击右上方登录的用户，在下拉列表中选择“我的凭证”。请根据“如何管理访问密钥”操作指导，确认当前AK/SK是否是当前账号创建的AK/SK。是，请联系提交工单处理。否，请根据“如何管理访问密钥”操作指导更换为当前账号的AK/SK。请确认当前账号是否欠费。是

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
如何用ModelArts训练基于结构化数据的模型？ - AI开发平台ModelArts

如何用ModelArts训练基于结构化数据的模型？针对一般用户，ModelArts提供自动学习的预测分析场景来完成结构化数据的模型训练。针对高阶用户，ModelArts在开发环境提供创建Notebook进行代码开发的功能，在训练作业提供创建大数据量训练任务的功能；用户在开发、

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
ModelArts自动学习所创建项目一直在扣费，如何停止计费？ - AI开发平台ModelArts

ModelArts自动学习所创建项目一直在扣费，如何停止计费？对于使用公共资源池创建的自动学习作业：登录ModelArts控制台，在自动学习作业列表中，删除正在扣费的自动学习作业。在训练作业列表中，停止因运行自动学习作业而创建的训练作业。在在线服务列表中，停止因运行自动学习作

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ

总条数： 2260

上一页
1
...
5
6
7
...
113
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Notebook中如何查看GPU使用情况 - AI开发平台ModelArts

如何查看训练作业资源占用情况？ - AI开发平台ModelArts

开发环境提示空间不足，如何解决？ - AI开发平台ModelArts

Ascend上如何查看实时性能指标？ - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

MoXing如何访问文件夹并使用get - AI开发平台ModelArts

如何查询自定义镜像的cuda和cudnn版本？ - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

Notebook无法执行代码，如何处理？ - AI开发平台ModelArts

ModelArts标注完样本集后，如何保证退出后不再产生计费？ - AI开发平台ModelArts

训练代码中，如何获取依赖文件所在的路径？ - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（Pytorch+CPU/GPU） - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？ - AI开发平台ModelArts

开发环境提示空间不足，如何解决？ - AI开发平台ModelArts

在Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

提示“上传的AK/SK不可用”，如何解决？ - AI开发平台ModelArts

如何用ModelArts训练基于结构化数据的模型？ - AI开发平台ModelArts

ModelArts自动学习所创建项目一直在扣费，如何停止计费？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线