搜索_华为云

不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置表1 不同模型推荐的参数与NPU卡数设置模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具 (Deepspeed) 规格与节点数 Qwen-VL Qwen-VL 7B full 2048 gr

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
Lite Server使用流程 - AI开发平台ModelArts

Server提供多样化的xPU裸金属服务器，赋予用户以root账号自主安装和部署AI框架、应用程序等第三方软件的能力，为用户打造专属的云上物理服务器环境。用户只需轻松选择服务器的规格、镜像、网络配置及密钥等基本信息，即可迅速创建弹性裸金属服务器，获取所需的云上物理资源，充分满足算法工程师在日常训练和推理工作中的需求。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
配置ModelArts Standard访问授权 - AI开发平台ModelArts

配置ModelArts Standard访问授权快速配置ModelArts委托授权创建IAM用户并授权使用ModelArts 父主题： ModelArts Standard准备工作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
VS Code手动连接Notebook - AI开发平台ModelArts

Host: 自定义设置的云上开发环境名称。 HostName: 云上开发环境的访问地址，即在开发环境实例页面远程访问模块获取的访问地址。例如：dev-modelarts-cnnorth4.huaweicloud.com Port: 云上开发环境的端口，即在开发环境实例页面远程访问模块获取的端口号。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

配置ModelArts委托授权章节中介绍的一键式自动授权方式创建的委托的权限比较大，基本覆盖了依赖服务的全部权限。如果华为云账号已经能满足您的要求，则不需要创建独立的IAM用户，您可以跳过本章节，不影响您使用MaaS服务的功能。 ModelArts作为一个完备的AI开发平台，支持用户对其进行细粒度的权限配置，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
设置断点续训练 - AI开发平台ModelArts

n_url”，在指定的训练输出的数据存储位置中保存Checkpoint，且“预下载至本地目录”选择“下载”。选择预下载至本地目录时，系统在训练作业启动前，自动将数据存储位置中的Checkpoint文件下载到训练容器的本地目录。图1 训练输出设置断点续训练建议和训练容错检查（即

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

IAM子用户：由主账号在IAM中创建的用户，是服务的使用人员，具有独立的身份凭证（密码和访问密钥），根据账号授予的权限使用资源。IAM子用户相关介绍请参见IAM用户介绍。联邦用户：又称企业虚拟用户。联邦用户相关介绍请参见联邦身份认证。委托用户：IAM中创建的一个委托。IAM创建委托相关介绍请参见创建委托。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
设置无条件自动重启 - AI开发平台ModelArts

适配断点续训，操作指导请参见设置断点续训练。当训练过程中触发了自动重启，则系统会记录重启信息，在训练作业详情页可以查看故障恢复详情，具体请参见训练作业重调度。开启无条件自动重启开启无条件自动重启有2种方式：控制台设置或API接口设置。控制台设置在创建训练作业页面，开启“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
日志提示“ Network is unreachable” - AI开发平台ModelArts

n.models中的pretrained置为了True，日志中出现如下报错： ‘OSError: [Errno 101] Network is unreachable’ 原因分析出现该问题的可能原因如下：因为安全性问题，ModelArts内部训练机器不能访问外网。处理方法

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
配置Lite Server网络 - AI开发平台ModelArts

单个弹性公网IP用于单个Server服务器：为单台Server服务器绑定一个弹性公网IP，该Server服务器独享网络资源。单个弹性公网IP用于多个Server服务器：一个VPC配置一个EIP（弹性公网IP），通过NAT网关配置进行EIP资源共享，实现该VPC下的所有Server服务器均可以通过该E

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
查询OS的配置参数 - AI开发平台ModelArts

查询OS的配置参数功能介绍获取ModelArts OS服务的配置参数，如网络网段，用户资源配额等。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

权限分配、访问控制等功能，可以帮助您安全的控制云服务资源的访问。如果华为账号已经能满足您的要求，不需要通过IAM对用户进行权限管理，您可以跳过本章节，不影响您使用ModelArts服务的其他功能。 IAM是提供权限管理的基础服务，无需付费即可使用，您只需要为您账号中的资源进行付费。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

复制完整资产名称获取待上传的文件名获取待上传的文件在服务器的绝对路径。上传单个文件在服务器执行如下命令，可以将服务器上的文件上传到AI Gallery仓库里面。 gallery-cli upload {repo_id} {文件名} 如下所示，表示将服务器上的文件“D:\workp

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
设置在线服务故障自动重启 - AI开发平台ModelArts

设置在线服务故障自动重启场景描述当系统检测到Snt9b硬件故障时，自动复位Snt9B芯片并重启推理在线服务，提升了推理在线服务的恢复速度。约束限制仅支持使用Snt9b资源的同步在线服务。只支持针对整节点资源复位，请确保部署的在线服务为8*N卡规格，请谨慎评估对部署在该节点的其他服务的影响。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
专属资源池VPC打通 - AI开发平台ModelArts

拉框中选择可用的VPC和子网。需要打通的对端网络不能和当前网段重叠。图2 打通VPC参数选择如果没有VPC可选，可以单击右侧的“创建虚拟私有云”，跳转到网络控制台，申请创建虚拟私有云。如果没有子网可选，可以单击右侧的“创建子网”，跳转到网络控制台，创建可用的子网。支持1

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

Gallery仓库在服务器执行如下命令，可以将AI Gallery仓库的所有文件下载到服务器的缓存目录下。 gallery-cli download {repo_id} 如下所示，表示下载AI Gallery仓库“test_cli_model1”到服务器的缓存目录“/test”下，当回显“100%”时表示下载完成。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
ECS获取基础镜像 - AI开发平台ModelArts

ECS获取基础镜像 Step1 登录ECS服务器根据创建ECS服务器创建完成ECS服务器后，单击“远程登录”，可使用华为CloudShell远程登录。后续安装Docker、获取镜像、构建镜像等操作均在该ECS上进行。 Step2 创建镜像组织在SWR服务页面创建镜像组织。图1

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
MoXing如何访问文件夹并使用get - AI开发平台ModelArts

MoXing如何访问文件夹并使用get_size读取文件夹大小？问题现象使用MoXing无法访问文件夹。使用MoXing的“get_size”读取文件夹大小，显示为0。原因分析使用MoXing访问文件夹，需添加参数：“recursive=True”，默认为False。处理方法

 帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错 - AI开发平台ModelArts

directory'). update products failed! 原因分析用户代码中设置的目标路径（local_path）有误。处理方法需要将local_path路径设置为文件夹且后缀必须以“/”结尾。父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
训练作业找不到GPU - AI开发平台ModelArts

根据报错提示，请您排查代码，是否已添加以下配置，设置该程序可见的GPU： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GPU编号，可以为0，1，2，3等，表明对程序可见的GPU编号。如果未进行添加配置则该编号对应的GPU不可用。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题

总条数： 1297

上一页
1
2
3
4
5
...
65
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

Lite Server使用流程 - AI开发平台ModelArts

配置ModelArts Standard访问授权 - AI开发平台ModelArts

VS Code手动连接Notebook - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

日志提示“ Network is unreachable” - AI开发平台ModelArts

配置Lite Server网络 - AI开发平台ModelArts

查询OS的配置参数 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

设置在线服务故障自动重启 - AI开发平台ModelArts

专属资源池VPC打通 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

ECS获取基础镜像 - AI开发平台ModelArts

MoXing如何访问文件夹并使用get - AI开发平台ModelArts

ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线