搜索_华为云

日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

日志提示“cuda runtime error (10) : invalid device ordinal at xxx” 问题现象训练作业失败，日志报出如下错误： RuntimeError: cuda runtime error (10) : invalid device ordinal

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
如何查询自定义镜像的cuda和cudnn版本？ - AI开发平台ModelArts

如何查询自定义镜像的cuda和cudnn版本？查询cuda版本： cat /usr/local/cuda/version.txt 查询cudnn版本： cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
Notebook如何离线安装VS Code Server - AI开发平台ModelArts

Notebook如何离线安装VS Code Server 背景介绍 VS Code执行remote-ssh远程连接时，会根据用户的VS Code版本去自动更新vscode-server和Vscode-client的版本，通过本地和远端尝试下载相关的安装脚本和包。当远端网络和本地网

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ ModelArts提供AI诊断功能，用户可以通过NCCl Test，测试节点GPU状态，并且测试多个节点间的通信速度。操作步骤单击资源池名称，进入资源池详情。单击左侧“AI组件管理 > AI诊断”。单击“诊断”，选择“日志上传路径”和NCCL

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
部署AI应用（在线服务） - AI开发平台ModelArts

部署AI应用（在线服务）部署为在线服务查看服务详情测试服务访问在线服务集成在线服务 CloudShell 父主题：部署AI应用（部署上线）

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 部署AI应用（部署上线）
公共参数 - AI开发平台ModelArts
公共参数 - AI开发平台ModelArts

公共参数状态码错误码获取项目ID和名称获取帐号名和帐号ID 获取用户名和用户ID

帮助中心 > AI开发平台ModelArts > API参考
ModelArts支持将模型部署为哪些类型的服务？ - AI开发平台ModelArts

ModelArts支持将模型部署为哪些类型的服务？支持在线服务、批量服务和边缘服务。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
什么是图像分类和物体检测？ - AI开发平台ModelArts

就是识别一张图中是否是某类/状态/场景，适合图中主体相对单一的场景，将下图识别为汽车的图片。图1 图像分类物体检测是计算机视觉中的经典问题之一，其任务是用框去标出图像中物体的位置，并给出物体的类别。通常在一张图包含多个物体的情况下，定制识别出每个物体的位置、数量、名称，适合图

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 功能咨询
使用pip install时出现“没有空间”的错误 - AI开发平台ModelArts

使用pip install时出现“没有空间”的错误问题现象在Notebook实例中，使用pip install时，出现“No Space left...”的错误。解决办法建议使用pip install --no-cache ** 命令安装，而不是使用pip install

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > Notebook实例常见错误
训练作业是否支持定时或周期调用？ - AI开发平台ModelArts

训练作业是否支持定时或周期调用？ ModelArts训练作业不支持定时周期化调用。当您的作业处于“运行中”状态时，可以按照业务需求进行调用。父主题：管理训练作业版本

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 管理训练作业版本
ModelArts通过OBS的API访问OBS中的文件，算内网还是公网？ - AI开发平台ModelArts

ModelArts通过OBS的API访问OBS中的文件，算内网还是公网？在同一区域，ModelArts通过OBS的API访问OBS中的文件属于内网通信，不消耗公网流量费。如果是通过互联网从OBS下载数据到本地，这时候会产生OBS公网流量费。OBS的详细计费说明可以参见计费项。

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
在Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

在Notebook中，如何使用昇腾多卡进行调试？昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
在Notebook中添加自定义IPython Kernel - AI开发平台ModelArts

在Notebook中添加自定义IPython Kernel 使用场景当前Notebook默认内置的引擎环境不能满足用户诉求，用户可以新建一个conda env按需搭建自己的环境。本小节以搭建一个“python3.6.5和tensorflow1.2.0”的IPython Kernel为例进行展示。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 环境配置相关
模型转换失败怎么办？ - AI开发平台ModelArts

败错误码来确认具体导失败的原因，Stable Diffusion新推出的模型在转换中可能会遇到算子不支持的问题，可以到华为云管理页面上提交工单来寻求帮助。父主题：常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 常见问题
什么是边缘节点？ - AI开发平台ModelArts

什么是边缘节点？边缘节点是您自己的边缘计算设备，用于运行边缘应用，处理您的数据，并安全、便捷地和云端应用进行协同。父主题：边缘服务

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 边缘服务
自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？不可以下载。但是您可以在AI应用管理页面查看，或者将此模型部署为在线服务。父主题：模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

训练模型时引用依赖包，如何创建训练作业？ ModelArts支持训练模型过程中安装第三方依赖包。在训练代码目录下放置“pip-requirements.txt”文件后，在训练启动文件被执行前系统会执行如下命令，以安装用户指定的Python Packages。 pip install

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

1个节点的专属资源池，能否部署多个服务？支持。在部署服务时，选择专属资源池，在选择“计算节点规格”时选择“自定义规格”，设置小一些或者选择小规格的服务节点规格，当资源池节点可以容纳多个服务节点规格时，就可以部署多个服务。如果使用此方式进行部署推理，选择的规格务必满足模型的要求

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池
实例重新启动后，Notebook内安装的插件丢失 - AI开发平台ModelArts

实例重新启动后，Notebook内安装的插件丢失请使用镜像保存功能。父主题： VS Code使用技巧

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
部署GPU服务支持的Cuda版本是多少？ - AI开发平台ModelArts

部署GPU服务支持的Cuda版本是多少？默认支持Cuda版本为10.2，如果需要更高的版本，可以提工单申请技术支持。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询

总条数： 1439

上一页
1
...
34
35
36
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

如何查询自定义镜像的cuda和cudnn版本？ - AI开发平台ModelArts

Notebook如何离线安装VS Code Server - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

部署AI应用（在线服务） - AI开发平台ModelArts

公共参数 - AI开发平台ModelArts

ModelArts支持将模型部署为哪些类型的服务？ - AI开发平台ModelArts

什么是图像分类和物体检测？ - AI开发平台ModelArts

使用pip install时出现“没有空间”的错误 - AI开发平台ModelArts

训练作业是否支持定时或周期调用？ - AI开发平台ModelArts

ModelArts通过OBS的API访问OBS中的文件，算内网还是公网？ - AI开发平台ModelArts

在Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

在Notebook中添加自定义IPython Kernel - AI开发平台ModelArts

模型转换失败怎么办？ - AI开发平台ModelArts

什么是边缘节点？ - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

实例重新启动后，Notebook内安装的插件丢失 - AI开发平台ModelArts

部署GPU服务支持的Cuda版本是多少？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线