搜索_华为云

日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

forked subprocess” 问题现象在使用pytorch启动多进程的时候，出现如下报错： RuntimeError: Cannot re-initialize CUDA in forked subprocess 原因分析出现该问题的可能原因如下： multiprocessing启动方式有误。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
标注多个标签，是否可针对一个标签进行识别？ - AI开发平台ModelArts

标注多个标签，是否可针对一个标签进行识别？数据标注时若标注多个标签进行训练而成的模型，最后部署成在线服务之后也是对标注的多个标签去进行识别的。如果只需要快速识别一种标签，建议单独训练识别此标签的模型使用，并选择较大的部署上线的规格也可以提供识别速度。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
如何通过ssh登录专属资源池节点？ - AI开发平台ModelArts

如何通过ssh登录专属资源池节点？ ModelArts专属资源池不支持ssh登录节点。父主题： Standard资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池
创建自动学习项目有个数限制吗？ - AI开发平台ModelArts

创建自动学习项目有个数限制吗？ ModelArts自动学习，包括图像分类项目、物体检测项目、预测分析项目、声音分类和文本分类项目。您最多只能创建100个自动学习项目。父主题：创建项目

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 创建项目
使用大模型在ModelArts Standard创建AI应用部署在线服务 - AI开发平台ModelArts

Standard创建AI应用部署在线服务背景说明目前大模型的参数量已经达到千亿甚至万亿，随之大模型的体积也越来越大。千亿参数大模型的体积超过200G，在版本管理、生产部署上对平台系统产生了新的要求。例如：导入AI应用时，需要支持动态调整租户存储配额；模型加载、启动慢，部署时需要灵活的超时配置；当负载异常重启，模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
Notebook如何离线安装VS Code Server - AI开发平台ModelArts

Code执行remote-ssh远程连接时，会根据用户的VS Code版本去自动更新vscode-server和Vscode-client的版本，通过本地和远端尝试下载相关的安装脚本和包。当远端网络和本地网络不通时，可以手动下载对应版本的Vscode-server包，然后离线安装。解决方法

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
自动学习项目中，如何进行增量训练？ - AI开发平台ModelArts

版本。当前一次的训练结果不满意时（如对训练精度不满意），您可以适当增加高质量的数据，或者增减标签，然后再次进行训练。增量训练目前仅支持“图像分类”、“物体检测”、“声音分类”类型的自动学习项目。为提升训练效果，建议在增量训练时，选择质量较高的数据，提升数据标注的质量。增量训练的操作步骤

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
在线服务部署是否支持包周期？ - AI开发平台ModelArts

在线服务部署是否支持包周期？在线服务不支持包周期的计费模式。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
视频数据集无法显示和播放视频 - AI开发平台ModelArts

视频数据集无法显示和播放视频若无法显示和播放视频，请检查视频格式类型，目前只支持MP4格式。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
开发环境如何实现IAM用户隔离？ - AI开发平台ModelArts

法查看、修改和删除他人创建的Notebook。目前有两种方案：方案一：删除modelarts:notebook:listAllNotebooks细粒度权限。方案二：使用工作空间功能：目前工作空间功能是“受邀开通”状态，作为企业用户您可以通过您对口的技术支持申请开通。父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
使用CodeLab时报错kernel restart - AI开发平台ModelArts

使用CodeLab时报错kernel restart 报错是由于CPU满了，建议切换更高规格或使用付费规格的CPU。图1 切换规格或使用付费规格的CPU 父主题： Notebook实例常见错误

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > Notebook实例常见错误
为什么选择不了Ascend Snt3资源？ - AI开发平台ModelArts

方法1：如果您希望使用公共资源池下的Ascend Snt3，可以等待其他用户释放，即其他使用Ascend Snt3芯片的服务停止，您即可选择此资源进行部署上线。方法2：如果专属资源池还有Ascend Snt3资源，您可以创建一个Ascend Snt3专属资源池使用。方法3：如果专属资源池的Ascend

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
开发环境提示空间不足，如何解决？ - AI开发平台ModelArts

当提示空间不足时，推荐使用EVS类型的Notebook实例。参考如何在Notebook中上传下载OBS文件？操作指导，针对原有的Notebook，首先将代码和数据上传至OBS桶中。然后创建一个EVS类型的Notebook，将此OBS中的文件下载至Notebook本地（指新建的EVS类型Notebook）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
部署服务如何选择计算节点规格？ - AI开发平台ModelArts

界面目前显示的节点规格是ModelArts根据用户的AI应用和资源池的节点规格计算得到，用户可以选择ModelArts提供的规格，也可以使用自定义规格（公共资源池不支持）。计算节点规格主要是根据用户AI应用实际需要的资源进行选择，如AI应用正常运行需要3U10G的资源，那么需要

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
服务部署失败，报错ModelArts.3520，服务总数超限 - AI开发平台ModelArts

allowed.”，表示服务数量超限。正常情况下，单个用户最多可创建20个在线服务。可采取以下方式处理：删除状态为“异常”的服务。删除长期不使用的服务。因业务原因需申请更大配额，可提工单申请扩容。父主题：在线服务

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
安装远端插件时不稳定，需尝试多次 - AI开发平台ModelArts

Code插件官网vscode_marketplace搜索待安装的Python插件，Python插件路径。单击进入Python插件的Version History页签后，下载该插件的离线安装包，如图所示。图1 Python插件离线安装包在本地VS Code环境中，将下载好的.vsix文件拖动到远端Notebook中。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
智能标注完成后新加入数据是否需要重新训练？ - AI开发平台ModelArts

智能标注完成后，需要对标注结果进行确认。如果未确认标注结果，直接加入新数据，重新智能标注，会将待确认的数据和新加入的数据全部重新训练。如果确认标注结果后，再加入新数据，只重新训练标注新的数据。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

部署在线服务时，您可以选择性能更好的“计算节点规格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“计算节点个数”。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。您可以根据实际需求进行选择。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

_out_cuda_frame failed with error code 0” 问题现象 pytroch1.3镜像中，去升级了pytroch1.4的版本，导致之前在pytroch1.3跑通的代码报错如下： “RuntimeError:max_pool2d_with_indices_out_cuda_frame

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题

总条数： 1506

上一页
1
...
18
19
20
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

标注多个标签，是否可针对一个标签进行识别？ - AI开发平台ModelArts

如何通过ssh登录专属资源池节点？ - AI开发平台ModelArts

创建自动学习项目有个数限制吗？ - AI开发平台ModelArts

使用大模型在ModelArts Standard创建AI应用部署在线服务 - AI开发平台ModelArts

Notebook如何离线安装VS Code Server - AI开发平台ModelArts

自动学习项目中，如何进行增量训练？ - AI开发平台ModelArts

在线服务部署是否支持包周期？ - AI开发平台ModelArts

视频数据集无法显示和播放视频 - AI开发平台ModelArts

开发环境如何实现IAM用户隔离？ - AI开发平台ModelArts

使用CodeLab时报错kernel restart - AI开发平台ModelArts

为什么选择不了Ascend Snt3资源？ - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

开发环境提示空间不足，如何解决？ - AI开发平台ModelArts

部署服务如何选择计算节点规格？ - AI开发平台ModelArts

服务部署失败，报错ModelArts.3520，服务总数超限 - AI开发平台ModelArts

安装远端插件时不稳定，需尝试多次 - AI开发平台ModelArts

智能标注完成后新加入数据是否需要重新训练？ - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线