搜索_华为云

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

GPU,but CUDA is not enabled” 原因分析出现该问题的可能原因如下：新安装的包与镜像中带的CUDA版本不匹配。处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

to use this pandas version 原因分析出现该问题的可能原因如下： conda和pip包混装，有一些包卸载不掉。处理方法参考如下代码，三步走。先卸载numpy中可以卸载的组件。删除你环境中site-packages路径下的numpy文件夹。重新进行安装需要的版本。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
更新处理任务 - AI开发平台ModelArts

tasks/{task_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 task_id 是 String 数据处理任务ID。请求参数表2 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？ - AI开发平台ModelArts

通过查看日志发现本地vscode-scp-done.flag显示成功上传，但远端未接收到。图1 vscode-scp-done.flag本地成功上传解决方法执行如下命令查看远端是否上传。 cd /home/ma-user/.vscode-server/bin/$commit_id #comm

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
查询AI应用列表 - AI开发平台ModelArts

/v1/{project_id}/models 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 model_name 否 String 模型名称，可支持

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

如果netron中没有显示inputShape，可能由于使用了动态shape模型导致，请确保使用的是静态shape模型，静态shape模型文件导出方法请参考模型准备。图1 netron中查看inputShape 精度选择。精度选择需要在模型转换阶段进行配置，执行converter_l

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
通过自定义镜像创建AI应用失败 - AI开发平台ModelArts

用户给ModelArts的委托中没有SWR相关操作权限用户为子账号，没有主账号SWR的权限使用的是非自己账号的镜像使用的镜像为公开镜像处理方法到SWR检查下对应的镜像是否存在，对应镜像的镜像地址是否和实际地址一致，大小写，拼写等是否一致。检查用户给ModelArts的委托中是

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
创建APP - AI开发平台ModelArts
创建APP - AI开发平台ModelArts

/v1/{project_id}/app-auth/apps 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 Content-Type 否 String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
删除AppCode - AI开发平台ModelArts
删除AppCode - AI开发平台ModelArts

APP编号，可通过APP列表接口获取。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
查询APP详情 - AI开发平台ModelArts

ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend） - AI开发平台ModelArts

使用自定义镜像创建训练作业时，需要您熟悉docker软件的使用，并具备一定的开发经验。详细步骤如下所示： Step1 创建OBS桶和文件夹 Step2 准备脚本文件并上传至OBS中 Step3 制作自定义镜像 Step4 上传镜像至SWR Step5 在ModelArts上创建Notebook并调试

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
更新MaaS模型服务的模型权重 - AI开发平台ModelArts

够成功完成推理任务。只有当验证成功，确保了模型权重的功能性和准确性后，才可以进行模型权重的滚动升级。获取待更新的模型权重文件，并上传到OBS桶中。参考创建我的模型，用待更新的模型权重文件新建一个我的模型。关键参数请参见表1。表1 创建模型的关键参数说明参数说明来源模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

可能系统资源不足、如内存不足、内存泄露。硬件故障、如IB网络或者GPU互联设备故障等。没安装nvidia-fabricmanager组件或被误卸载。处理方法若未安装fabricmanager，则需安装改组件。若已安装fabricmanager，运行以下命令重启fabricmanager.service。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
创建标注团队的成员 - AI开发平台ModelArts

rce_id}/workers 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_id 是 String 标注团队ID。请求参数表2 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建标注团队 - AI开发平台ModelArts

/v2/{project_id}/workforces 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 标

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询OS的配额 - AI开发平台ModelArts

/v1/{project_id}/quotas 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 quotas Quota

帮助中心 > AI开发平台ModelArts > API参考 > 配额管理
日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

间完成的，然后有的节点没有复制完，其他节点进行torch.distributed.init_process_group()导致超时。处理方法如果是多个节点复制不同步，并且没有barrier的话导致的超时，可以在复制数据之前，先进行torch.distributed.init_

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

如果cuda相关运算设置的卡ID号在所选规格范围内，但是依旧出现了上述报错。可能是该资源节点中存在GPU卡损坏的情况，导致实际能检测到的卡少于所选规格。处理方法建议直接根据系统分卡情况下传进去的CUDA_VISIBLE_DEVICES去设置，不用手动指定默认的。如果发现资源节点中存在GPU卡损坏，请联系技术支持处理。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
批量删除节点 - AI开发平台ModelArts

es/batch-delete 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。请求参数表2 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询OS的配置参数 - AI开发平台ModelArts

/v1/{project_id}/os-user-config 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 networkCidrs

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理

总条数： 1739

上一页
1
...
74
75
76
...
87
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

更新处理任务 - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？ - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

通过自定义镜像创建AI应用失败 - AI开发平台ModelArts

创建APP - AI开发平台ModelArts

删除AppCode - AI开发平台ModelArts

查询APP详情 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend） - AI开发平台ModelArts

更新MaaS模型服务的模型权重 - AI开发平台ModelArts

GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

创建标注团队的成员 - AI开发平台ModelArts

创建标注团队 - AI开发平台ModelArts

查询OS的配额 - AI开发平台ModelArts

日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

批量删除节点 - AI开发平台ModelArts

查询OS的配置参数 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线