搜索_华为云

配置SWR组织权限 - AI开发平台ModelArts

配置SWR组织权限 IAM用户创建后，需要管理员在组织中为用户添加授权，使IAM用户对组织内所有镜像享有读取/编辑/管理的权限。只有具备“管理”权限的账号和IAM用户才能添加授权。登录容器镜像服务控制台。在左侧菜单栏选择“组织管理”，单击组织名称。在“用户”页签下单击“添加授权”

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

操作步骤如下：注册镜像。登录ModelArts控制台，在左侧导航栏选择“镜像管理”，进入镜像管理页面。单击“注册镜像”，镜像源即为推送到SWR中的镜像。请将完整的SWR地址复制到这里即可，或单击可直接从SWR选择自有镜像进行注册，类型加上“GPU”，如图1所示。图1 注册镜像登录Mo

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
分布式训练功能介绍 - AI开发平台ModelArts

分布式训练功能介绍 ModelArts提供了如下能力：丰富的官方预置镜像，满足用户的需求。支持基于预置镜像自定义制作专属开发环境，并保存使用。丰富的教程，帮助用户快速适配分布式训练，使用分布式训练极大减少训练时间。分布式训练调测的能力，可在PyCharm/VSCode/J

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

“文本生成”之外的类型（即自定义模型），则模型文件必须满足自定义模型规范（推理）才支持模型自定义推理。当使用自定义镜像部署推理服务时，要确认镜像是否满足自定义镜像规范，否则无法成功完成推理服务的部署。部署推理服务登录AI Gallery。单击“模型”进入模型列表。选择需

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

务（OBS）中，接着通过ModelArts数据管理进行标注和版本管理，然后通过训练获得AI模型结果，最后通过开发环境构建模型镜像。服务运维阶段，先利用镜像构建模型，接着部署模型为在线服务，然后可在云监控服务（CES）中获得ModelArts推理在线服务的监控数据，最后可配置告警规则实现实时告警通知。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
服务状态一直处于“部署中” - AI开发平台ModelArts

先检查创建模型的端口是否正确。处理方法模型的端口没有配置，如您在自定义镜像配置文件中修改了端口号，需要在部署模型时，配置对应的端口号，使新的模型重新部署服务。如何修改默认端口号，请参考使用自定义镜像创建在线服务，如何修改默认端口。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
开发环境的应用示例 - AI开发平台ModelArts

创建开发环境实例的流程如下：调用认证鉴权接口获取用户Token，在后续的请求中需要将Token放到请求消息头中作为认证。调用查询支持的镜像列表接口查看开发环境的镜像类型和版本。调用创建Notebook实例接口创建一个Notebook实例。调用查询Notebook实例详情接口根据Notebook实例的ID查询实例的创建详情。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

Platform=ModelArts-Service 原因分析出现该问题的可能原因如下：用户的自定义镜像中无ascend_check工具，导致启动预检失败。用户的自定义镜像中的ascend相关工具不可用，导致预检失败。处理方法通过给训练作业加环境变量“MA_DETECT_

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > Ascend相关问题
Moxing安装文件如何获取？ - AI开发平台ModelArts

Moxing安装文件如何获取？ Moxing安装文件不支持下载和用户自主安装。在ModelArts的Notebook和训练作业镜像中预置了Moxing安装包，用户可以直接引用。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

创建模型成功后，部署服务报错，如何排查代码问题问题现象创建模型成功后，部署服务失败，如何定位是模型代码编写有问题。原因分析用户自定义镜像或者通过基础镜像导入的模型时，用户自己编写了很多自定义的业务逻辑，这些逻辑有问题将会导致服务部署或者预测失败，需要能够排查出哪里有问题。处理方法

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
查询Notebook实例详情 - AI开发平台ModelArts

swr_path String SWR镜像地址。 tag String 镜像Tag。 type String 镜像类型。枚举值如下： BUILD_IN：系统内置镜像。 DEDICATED：用户保存的镜像。 update_at Long 镜像最后更新的时间，UTC毫秒。 visibility

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
AI引擎Scikit_Learn0.18.1的运行环境怎么设置？ - AI开发平台ModelArts

AI引擎Scikit_Learn0.18.1的运行环境怎么设置？在ModelArts的算法管理页面，创建算法时勾选“显示旧版镜像”，选择XGBoost-Sklearn引擎即可。 ModelArts创建算法操作请参见创建算法。 ModelArts创建训练作业操作请参见创建训练作业。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
更新Notebook实例 - AI开发平台ModelArts

swr_path String SWR镜像地址。 tag String 镜像Tag。 type String 镜像类型。枚举值如下： BUILD_IN：系统内置镜像。 DEDICATED：用户保存的镜像。 update_at Long 镜像最后更新的时间，UTC毫秒。 visibility

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
CUDA和CUDNN - AI开发平台ModelArts
CUDA和CUDNN - AI开发平台ModelArts

driver version : 440.95.01 gpu driver version : 440.95.01（GPU驱动在宿主机中安装，镜像中无需安装） cuda runtime version : 10.2（PyTorch自带，无需关心） cudnn version : 7.6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
日志提示"Permission denied" - AI开发平台ModelArts

777 -R /nas 如果是自定义镜像中拉取的.sh脚本没有执行权限，可以在自定义脚本启动前执行"chmod +x xxx.sh"添加可执行权限。 ModelArts控制台上创建训练作业自定义镜像入口，默认以1000 uid用户来启动v2容器镜像，将ma-user的uid从110

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
离线训练安装包准备说明 - AI开发平台ModelArts

离线训练安装包准备说明在华为公有云平台，申请的资源一般要求连通网络。因此用户在准备环境时可以运行 scripts/install.sh 直接下载安装资源，或通过 Dockerfile 下载安装资源并构建一个新的镜像。若用户的机器或资源池无法连通网络，并无法git clone下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

t”的ID码。确认创建Notebook实例使用的镜像的系统架构，可以在Notebook中打开Terminal，通过命令uname -m查看。下载对应版本的vscode-server，根据Commit码和Notebook实例镜像架构下载。如果下载报错“Not Found”，请下载别的版本VS

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
infiniband驱动的安装 - AI开发平台ModelArts

您可以直接安装infiniband官方驱动，以使用infiniband网卡进行分布式通信，提升训练性能。infiniband驱动需要在制作镜像时安装。操作步骤下载MLNX_OFED_LINUX-4.3-1.0.1.0-ubuntu16.04-x86_64.tgz。进入地址，

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” 问题现象 pytroch1.3镜像中，去升级了pytroch1.4的版本，导致之前在pytroch1.3跑通的代码报错如下： “RuntimeError:max_pool2

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
免费资产和商用资产 - AI开发平台ModelArts

品购买。当前支持商业售卖的资产类型：算法、模型免费资产使用事项订阅和发布免费资产需要您按照指导注册华为帐号并开通华为云；发布HiLens技能除了需要注册华为账号并开通华为云还需要入驻AI Gallery。发布的免费资产将展示在AI Gallery的公共页签以及“我的Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）

总条数： 1511

上一页
1
...
11
12
13
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置SWR组织权限 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

服务状态一直处于“部署中” - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

Moxing安装文件如何获取？ - AI开发平台ModelArts

创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

查询Notebook实例详情 - AI开发平台ModelArts

AI引擎Scikit_Learn0.18.1的运行环境怎么设置？ - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

CUDA和CUDNN - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

infiniband驱动的安装 - AI开发平台ModelArts

日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

免费资产和商用资产 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线