搜索_华为云

如何查看ModelArts训练作业资源占用情况？ - AI开发平台ModelArts

如何查看ModelArts训练作业资源占用情况？在ModelArts管理控制台，选择“模型训练>训练作业”，进入训练作业列表页面。在训练作业列表中，单击目标作业名称，查看该作业的详情。您可以在“资源占用情况”页签查看到如下指标信息。 CPU：CPU使用率（cpuUsage）百分比（Percent）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
特权池信息数据显示均为0%如何解决？ - AI开发平台ModelArts

特权池信息数据显示均为0%如何解决？问题现象特权池基本信息页面数据均显示为0%（如CPU使用率、内存使用率、加速卡使用率、加速卡显存使用率）。原因分析原因是集群没有安装ICAgent。新建特权池时默认会安装ICAgent，可能由于用户自行卸载ICAgent，导致资源池数据显示异常。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决问题现象 GP Vnt1裸金属服务器，操作系统为EulerOS 2.9(基于CentOS制作的Linux发行版)，经常遇到服务器重启后，操作系统内核无故升级，导致系统上原安装的nvidia-driver等软件无法使用，只能卸载重新安装。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
在ModelArts中使用自定义镜像创建在线服务，如何修改端口？ - AI开发平台ModelArts

在ModelArts中使用自定义镜像创建在线服务，如何修改端口？当模型配置文件中定义了具体的端口号，例如：8443，创建模型没有配置端口，或者配置了其他端口号，均会导致服务部署失败。您需要把模型中的端口号配置为8443，才能保证服务部署成功。修改默认端口号，具体操作如下：登

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？问题定位和处理创建模型失败有两种场景：创建模型时直接报错或者是调用API报错和创建模型任务下发成功，但最终模型创建失败。创建模型时直接报错或者是调用API报错。一般都是输入参数不合法导致的。您可以根据提示信息进行排查修改即可。创建模型任务

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
在ModelArts中使用Moxing复制数据时如何定义路径变量？ - AI开发平台ModelArts

在ModelArts中使用Moxing复制数据时如何定义路径变量？问题描述 mox.file.copy_parallel(src_obs_dir=input_storage,'obs://dyyolov8/yolov5_test/yolov5-7.0/datasets'), m

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
管理Lite Cluster资源池 - AI开发平台ModelArts

lArts如何通过标签实现资源分组管理。图3 标签最多支持添加20个标签。 Lite Cluster资源池配置管理在资源池详情页面，单击“配置管理”，在配置管理页面，可以修改设置监控的命名空间、修改集群配置，配置镜像预热信息。单击监控的图标，可以开启或关闭监控信息，并设置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
在ModelArts的Notebook中如何在代码中打印GPU使用信息？ - AI开发平台ModelArts

在ModelArts的Notebook中如何在代码中打印GPU使用信息？用户可通过shell命令或python命令查询GPU使用信息。使用shell命令执行nvidia-smi命令。依赖CUDA nvcc watch -n 1 nvidia-smi 执行gpustat命令。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？问题现象 JupyterLab中保存文件时报错如下：原因分析浏览器安装了第三方插件proxy进行了拦截，导致无法进行保存。在Notebook中的运行文件超过指定大小就会提示此报错。 jupyter页面打开时间太长。网络环境原因，是否有连接网络代理。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
在ModelArts中如何将标注结果下载至本地？ - AI开发平台ModelArts

在ModelArts中如何将标注结果下载至本地？ ModelArts数据集中的标注信息和数据在发布后，将以manifest格式存储在“数据集输出位置”对应的OBS路径下。路径获取方式：在ModelArts管理控制台，进入“数据管理>数据集”。选择需查看数据集，单击名称左侧小

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

出现ModelArts.6333错误，如何处理？问题现象在使用Notebook过程中，界面出现“ModelArts.6333”报错信息。原因分析可能由于实例过负载引起故障，Notebook正在自动恢复中，请刷新页面并等待几分钟。常见原因是内存占用满。处理方法当出现此错

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
在ModelArts的Notebook中如何查看GPU使用情况？ - AI开发平台ModelArts

在ModelArts的Notebook中如何查看GPU使用情况？创建Notebook时，当您选择的类型为GPU时，查看GPU使用情况具体操作如下：登录ModelArts管理控制台，选择“开发空间>Notebook”。在Notebook列表中，单击目标Notebook“操作”

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
在ModelArts的Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

在ModelArts的Notebook中，如何访问其他账号的OBS桶？创建Notebook时选择OBS存储，这种情况下只能访问到自己账号下的桶，无法访问到其他账号的OBS桶。如果需要在Notebook中，访问其他账号的OBS文件，前提是，需获取目标OBS桶的读写权限。首先，

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
如何将两个ModelArts数据集合并？ - AI开发平台ModelArts

如何将两个ModelArts数据集合并？目前不支持直接合并。但是可以参考如下操作方式，将两个数据集的数据合并在一个数据集中。例如需将数据集A和数据集B进行合并。分别将数据集A和数据集B进行发布。发布后可获得数据集A和数据集B的Manifest文件。可通过数据集的“数据集输出位置”获得此文件。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
在ModelArts训练时如何安装C++的依赖库？ - AI开发平台ModelArts

在ModelArts训练时如何安装C++的依赖库？在训练作业的过程中，会使用到第三方库。以C++为例，请参考如下操作步骤进行安装：将源码下载至本地并上传到OBS。使用OBS客户端上传文件的操作请参见上传文件。将上传到OBS的源码使用Moxing复制到开发环境Notebook中。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？如果您在创建Notebook实例之后，打开Notebook时，因报错导致无法打开页面，您可以根据以下对应的错误码来排查解决。打开Notebook显示黑屏 Notebook打开后黑屏，由于代理问题导致，切换代理。打开Notebook显示空白

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
MoXing如何访问文件夹并使用get - AI开发平台ModelArts

MoXing如何访问文件夹并使用get_size读取文件夹大小？问题现象使用MoXing无法访问文件夹。使用MoXing的“get_size”读取文件夹大小，显示为0。原因分析使用MoXing访问文件夹，需添加参数：“recursive=True”，默认为False。处理方法

 帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
应用场景 - AI开发平台ModelArts
应用场景 - AI开发平台ModelArts

金融为金融机构带来更加高效、智能、精准的服务。矿山提供端到端AI生产线能力和高性能AI算力，提升大模型推理效率，为矿山行业带来更高效、智能、安全和可持续的生产方案。铁路实现列车智能调度、设备故障预测、铁路线路安全监控等功能。医疗报告智能解读、互联网检验以及居民全周期

 帮助中心 > AI开发平台ModelArts > 产品介绍
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ ModelArts提供AI诊断功能，用户可以通过NCCl Test，测试节点GPU状态，并且测试多个节点间的通信速度。操作步骤单击资源池名称，进入资源池详情。单击左侧“AI组件管理 > AI诊断”。单击“诊断”，选择“日志上传路径”和NCCL

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？场景描述在使用ModelArts进行自定义深度学习训练时，训练数据通常存储在对象存储服务（OBS）中，且训练数据较大时（如200GB以上），每次都需要使用GPU资源池进行训练，且训练效率低。希望提升训练效率，同时减

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练

总条数： 1222

上一页
1
...
5
6
7
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何查看ModelArts训练作业资源占用情况？ - AI开发平台ModelArts

特权池信息数据显示均为0%如何解决？ - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

在ModelArts中使用自定义镜像创建在线服务，如何修改端口？ - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

在ModelArts中使用Moxing复制数据时如何定义路径变量？ - AI开发平台ModelArts

管理Lite Cluster资源池 - AI开发平台ModelArts

在ModelArts的Notebook中如何在代码中打印GPU使用信息？ - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

在ModelArts中如何将标注结果下载至本地？ - AI开发平台ModelArts

出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

在ModelArts的Notebook中如何查看GPU使用情况？ - AI开发平台ModelArts

在ModelArts的Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

如何将两个ModelArts数据集合并？ - AI开发平台ModelArts

在ModelArts训练时如何安装C++的依赖库？ - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

MoXing如何访问文件夹并使用get - AI开发平台ModelArts

应用场景 - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线