搜索_华为云

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

Step2 为用户配置云服务使用权限主用户为子账号授予ModelArts、OBS等云服务的使用权限后，子账号才可以使用这些云服务。此步骤介绍如何为用户组中的所有子账号授予使用ModelArts、OBS、SWR等各类云服务的权限。主用户在IAM服务的用户组列表页面，单击“授权”，进入到授权页面，为子账号配置权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

x86_64架构的主机，操作系统使用ubuntu-18.04。您可以准备相同规格的弹性云服务器ECS或者应用本地已有的主机进行自定义镜像的制作。购买ECS服务器的具体操作请参考购买并登录Linux弹性云服务器。“CPU架构”选择“x86计算”，“镜像”选择“公共镜像”，推荐使用Ubuntu18

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

x86_64架构的主机，操作系统使用ubuntu-18.04。您可以准备相同规格的弹性云服务器ECS或者应用本地已有的主机进行自定义镜像的制作。购买ECS服务器的具体操作请参考购买并登录Linux弹性云服务器。“CPU架构”选择“x86计算”，“镜像”选择“公共镜像”，推荐使用Ubuntu18

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
ECS中构建新镜像（可选） - AI开发平台ModelArts

ECS中构建新镜像（可选）通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
VS Code手动连接Notebook - AI开发平台ModelArts

本章节介绍基于VS Code环境访问Notebook的方式。前提条件已下载并安装VS Code。详细操作请参考安装VS Code软件。用户本地PC或服务器的操作系统中建议先安装Python环境，详见VSCode官方指导。创建一个Notebook实例，并开启远程SSH开发。该实例状态必须处于

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

使用自定义镜像创建开发环境Notebook实例。按需配置。使用SSH功能 ECS ecs:serverKeypairs:list ecs:serverKeypairs:get ecs:serverKeypairs:delete ecs:serverKeypairs:create 为开发环境Notebook实例配置登录密钥。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
创建生产训练作业 - AI开发平台ModelArts

置请参见分布式训练功能介绍。永久保存日志选择CPU或者GPU资源时，支持选择是否关闭“永久保存日志”开关。开关打开（默认打开）：表示永久保存日志，此时必须配置“作业日志路径”，系统会将训练日志永久保存至指定的OBS路径。开关关闭：表示不永久保存日志，则训练日志会在30天后

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
管理开发环境实例 - AI开发平台ModelArts

String 操作开发环境实例，支持： start stop restart queue dequeue 其中，queue和dequeue仅支持对免费资源进行操作。响应消息响应参数如表3所示。表3 响应参数参数参数类型说明 current_status String 实例当前状态。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
Lite Cluster资源开通 - AI开发平台ModelArts

在服务配额页面，单击右上角的“申请扩大配额”，填写申请材料后提交工单。申请扩大配额主要是申请弹性云服务器ECS实例数、核心数（CPU核数）、RAM容量（内存大小）和云硬盘EVS磁盘容量这4个资源配额。具体的配额数量请先联系客户经理获取。图7 ECS资源类型图8 云硬盘资源类型配额需大于需要开通的资源，且在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

IDL中的WebSocket API由W3C标准化。 WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。前提条件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
管理Lite Cluster节点 - AI开发平台ModelArts

留。 - 重部署：通过更换为新服务器实现修复，修复耗时较短，本地盘数据会丢失。修复期间实例将无法工作，请确保相关实例业务已离线。如果云服务器上的业务不可停止，请勿修复，并联系技术支持进行处理。若选择了重部署修复方式，实例会立即关机并迁移到新服务器，本地盘数据会被清空，请提前做好业务迁移和数据备份。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

IDL中的WebSocket API由W3C标准化。 WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。前提条件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

“资源池”：选择“公共资源池”。 “模型来源”和“选择模型及版本”：会自动选择模型和版本号。 “计算节点规格”：在下拉框中选择“限时免费”资源，勾选并阅读免费规格说明。其他参数可使用默认值。如果限时免费资源售罄，建议选择收费CPU资源进行部署。当选择收费CPU资源部署在线服务时会收取少量资源费用，具体费用以界面信息为准。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
pipeline应用准备 - AI开发平台ModelArts

Diffusion v1.5的onnx pipeline代码为例进行说明。进入容器环境，创建自己的工作目录。由于在Snt9B裸金属服务器环境配置指南的配置环境步骤中，在启动容器时将物理机的home目录挂载到容器的“/home_host”目录下，该目录可以直接使用上传到物理机

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
训练作业找不到GPU - AI开发平台ModelArts

可见的GPU： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GPU编号，可以为0，1，2，3等，表明对程序可见的GPU编号。如果未进行添加配置则该编号对应的GPU不可用。父主题： GPU相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
将数据预热到SFS Turbo - AI开发平台ModelArts

从OBS导入到SFS Turbo高性能文件存储中，数据预热功能的具体操作请参考创建SFS Turbo 和 OBS 之间的联动任务。在ECS服务器挂载SFS Turbo已经将SFS Turbo挂载到了/mnt/sfs_turbo目录，这里参考obsutil文档，直接使用obsut

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

关于Ant8裸金属服务器的购买，可以在华为云官网提工单至ModelArts云服务，完成资源的申请。步骤1 安装模型安装Megatron-DeepSpeed框架。使用root用户SSH的方式登录GPU裸金属服务器。具体登录方式请参见SSH密钥方式登录裸金属服务器。拉取pyto

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
使用MaaS调优模型 - AI开发平台ModelArts

选择规格，规格中描述了服务器类型、型号等信息，仅显示模型支持的资源。计算节点个数当计算节点个数大于1，将启动多节点分布式训练。详细信息，请参见分布式训练功能介绍。更多选项永久保存日志选择是否打开“永久保存日志”开关。开关关闭（默认关闭）：表示不永久保存日志，则任务日志会

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

GPU大规模集群的一体化工具，提供多种能力，包括主动健康监控、诊断、系统验证、策略、电源和时钟管理、配置管理和审计等。约束限制仅适用于GPU资源监控。前提条件裸金属服务器需要安装driver、cuda、fabric-manager软件包。步骤一：安装Docker 使用Docker官方脚本安装最新版Docker：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
Standard推理部署 - AI开发平台ModelArts

Standard推理部署 ModelArts Standard推理服务访问公网方案端到端运维ModelArts Standard推理服务方案使用自定义引擎在ModelArts Standard创建模型使用大模型在ModelArts Standard创建模型部署在线服务第三方推理框架迁移到ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践

总条数： 940

上一页
1
...
9
10
11
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

ECS中构建新镜像（可选） - AI开发平台ModelArts

VS Code手动连接Notebook - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

管理开发环境实例 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

将数据预热到SFS Turbo - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

Standard推理部署 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线