搜索_华为云

GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

GPU A系列裸金属服务器无法获取显卡如何解决问题现象在A系列裸金属服务器上使用PyTorch一段时间后，出现获取显卡失败的现象，报错如下： > torch.cuda.is_available() /usr/local/lib/python3.8/dist-packages/torch/cuda/__init__

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
上传算法至SFS - AI开发平台ModelArts

修改lr_scheduler.py文件，把第27行：t_mul=1. 注释掉。修改data文件夹下imagenet22k_dataset.py，把第28行：print("ERROR IMG LOADED: ", path) 注释掉。修改data文件夹下的build.py文件，把第112行：prefix

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

打开并配置whitelist.conf文件。 vim whitelist.conf 配置内容为安全控制可访问的地址，支持配置通配符，例如： .apig.cn-east-3.huaweicloudapis.com 如果地址访问不通，请在浏览器配置访问域名。打开并配置squid.conf文件。 vim squid

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
创建训练作业版本 - AI开发平台ModelArts

作业时，spec_id必选，且不能与pool_id同时出现。 pool_id 是 String 专属资源池ID。可在ModelArts管理控制台，单击左侧“专属资源池”，在专属资源池列表中查看资源池ID。创建专属池作业时，pool_id必选，且不能与spec_id同时出现。 engine_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
重试/停止/运行Workflow节点 - AI开发平台ModelArts

重试/停止/运行Workflow节点重试/停止/继续运行Workflow节点重试当单个节点运行失败时，用户可以通过重试按钮重新执行当前节点，无需重新启动工作流。在当前节点的运行状况页面，单击“重试”。在重试之前您也可以前往权限管理页面修改配置，节点重试启动后新修改的配置信息可以在当前执行中立即生效。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

可靠、高性能、规格丰富并且可弹性扩展的块存储服务，数据持久性高达99.9999999%。训练故障自动恢复用户在训练模型过程中，存在因硬件故障而产生的训练失败场景。针对硬件故障场景，ModelArts提供容错检查功能，帮助用户隔离故障节点，优化用户训练体验。容错检查包括两个检

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

clone Hugging Face上的模型，以SD模型为例。如果下载时若出现“SSL_ERROR_SYSCALL”报错，多重试几次即可。另外由于网络限制以及文件较大，下载可能很慢需要数个小时，如果重试多次还是失败，建议直接从网站下载大文件后上传到服务器/home目录的个人开发目

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

ModelArts提供了AI全流程开发的套餐包，面向有AI基础的开发者，提供机器学习和深度学习的算法开发及部署全功能，包含数据处理、模型开发、模型训练、模型管理和模型部署流程。约束限制套餐包在购买和使用时的限制如下：套餐包和购买时选定的区域绑定，套餐包只能使用于购买时选定的区域，且只

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
在ModelArts中如何将Notebook A的数据复制到Notebook B中？ - AI开发平台ModelArts

B，如果需要复制数据，可参考如下步骤操作：将Notebook A的数据上传至OBS；下载OBS中的数据至Notebook B。文件的上传下载详细操作请参考如何在ModelArts的Notebook中上传下载OBS文件？。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
日志提示“ '(slice(0, 13184, None), slice(None, None, None))' is an invalid key” - AI开发平台ModelArts

迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

-V)查看该镜像的cuda版本（customize_service.py编写指导请见模型推理代码编写说明）。确认该cuda版本与您安装的mmcv版本是否匹配。部署时是否需要使用GPU，取决于的模型需要用到CPU还是GPU，以及推理脚本如何编写。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
ModelArts Standard资源监控概述 - AI开发平台ModelArts

GPU或NPU资源使用情况。具体请参见训练资源监控章节。 Standard在线服务：用户将模型部署为在线服务后，可以通过监控功能查看该推理服务的CPU、内存或GPU等资源使用统计信息和模型调用次数统计，具体参见查看推理服务详情章节。方式二：通过AOM查看所有监控指标 ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

建议您尽快续费。具体受限操作如表3所示：表3 欠费受限操作功能受限操作 Workflow 订阅Workflow、模型训练、模型部署自动学习模型训练、模型部署 Notebook 创建Notebook、启动Notebook 训练作业创建训练作业在线服务、边缘服务部署在线服务、边缘服务

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
在ModelArts中如何将图片划分到验证集或者训练集？ - AI开发平台ModelArts

数。设置好“训练集比例”后，“验证集比例”自动填充。“训练集比例”加“验证集比例”等于1。 “训练集比例”即用于训练模型的样本数据比例；“验证集比例”即用于验证模型的样本数据比例。“训练验证比例”会影响训练模板的性能。父主题： Standard数据准备

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
日志报错“DataFrame.dtypes for data must be int, float or bool” - AI开发平台ModelArts

迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
如何查看ModelArts中正在收费的作业？ - AI开发平台ModelArts

据。模型部署：模型部署为在线服务、边缘服务时，会收取费用，使用完请及时停止服务。同时，也需清理存储到OBS中的数据。专属资源池：在使用ModelArts进行AI全流程开发时，如果购买了专属资源池，同时在运行自动学习作业、Workflow工作流、Notebook实例、模型训练和

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题

总条数： 2329

上一页
1
...
91
92
93
...
117
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

在ModelArts中如何将Notebook A的数据复制到Notebook B中？ - AI开发平台ModelArts

日志提示“ '(slice(0, 13184, None), slice(None, None, None))' is an invalid key” - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

在ModelArts中如何将图片划分到验证集或者训练集？ - AI开发平台ModelArts

日志报错“DataFrame.dtypes for data must be int, float or bool” - AI开发平台ModelArts

如何查看ModelArts中正在收费的作业？ - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线