搜索_华为云

使用MaaS压缩模型 - AI开发平台ModelArts

型压缩适用于追求更高的推理服务性能、低成本部署以及可接受一定精度损失的场景。 ModelArts Studio大模型即服务平台当前支持SmoothQuant-W8A8和AWQ-W4A16两种压缩策略。表1 压缩策略的适用场景压缩策略场景 SmoothQuant-W8A8 长序列的场景

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在ModelArts Standard上运行GPU单机单卡训练任务 - AI开发平台ModelArts

Standard上运行GPU单机单卡训练任务操作流程准备工作购买服务资源（OBS和SWR）配置权限创建专属资源池（不需要打通VPC）安装和配置OBS命令行工具（可选）工作空间配置模型训练本地构建镜像及调试上传镜像上传数据和算法到OBS 使用Notebook进行代码调试

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 - AI开发平台ModelArts

实例连接错误，可能是配置文件写的不规范导致连接到别的实例。解决方案检查用户.ssh配置文件（路径一般在“C:\Users\{User}\.ssh\config”下），检查每组配置文件是否规范：Host必须放在每组配置的第一行，作为每组配置的唯一ID。如下，第一组配置文件不规范将H

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
LoRA微调训练 - AI开发平台ModelArts

在Notebook中修改训练超参配置以llama2-13b LORA微调为例，执行脚本0_pl_lora_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。表1 必须修改的训练超参配置参数示例值参数说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
VS Code中设置远端默认安装的插件 - AI开发平台ModelArts

VS Code中设置远端默认安装的插件在VS Code的配置文件settings.json中添加remote.SSH.defaultExtensions参数，如自动安装Python和Maven插件，可配置如下。 "remote.SSH.defaultExtensions": [

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
使用自定义镜像创建在线服务，如何修改默认端口 - AI开发平台ModelArts

使用自定义镜像创建在线服务，如何修改默认端口当模型配置文件中定义了具体的端口号，例如：8443，创建AI应用没有配置端口（默认端口号为8080），或者配置了其他端口号，均会导致服务部署失败。您需要把AI应用中的端口号配置为8443，才能保证服务部署成功。修改默认端口号，具体操作如下：登

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
管理ModelArts模型版本 - AI开发平台ModelArts

已在ModelArts中创建模型。创建新版本在“模型”页面，单击操作列的“创建新版本”进入“创建新版本”页面，参数配置除版本外，将默认选择上一个版本的配置信息，您可以对参数配置进行修改，参数说明请参见创建模型。单击“立即创建”，完成新版本的创建操作。删除版本在“模型管理”页面，单击

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
在线服务 - AI开发平台ModelArts
在线服务 - AI开发平台ModelArts

header和request body 作为调用发起方的客户端无法访问已经获取到的推理请求地址服务部署失败，报错ModelArts.3520，服务总数超限配置了合理的服务部署超时时间，服务还是部署失败，无法启动父主题：部署上线

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线
Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

path；用户使用了已开启sudo权限的专属池，使用自定义镜像时，sudo工具未安装或安装错误；用户使用的cann、cuda环境有兼容性问题；用户的docker镜像配置错误、网络或防火墙限制、镜像构建问题（文件权限、依赖缺失或构建命令错误）等原因导致的。父主题：自定义镜像故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
附录：微调训练常见问题 - AI开发平台ModelArts

附录：微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
PyCharm ToolKit工具中Edit Credential时，出现错误 - AI开发平台ModelArts

例如：Endpoint配置不正确也会导致认证失败。错误示例：Endpoint参数前面带了https，正确的配置中不需要有https。图1 配置ToolKit 二、未配置hosts文件或者hosts文件信息配置不正确在本地PC的hosts文件中配置域名和IP地址的对应关系。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > PyCharm Toolkit使用
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed) 规格与节点数 llama2 llama2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
在ModelArts Standard上运行GPU单机多卡训练任务 - AI开发平台ModelArts

准备工作：购买服务资源（VPC、SFS、SWR和ECS）配置权限创建专属资源池（打通VPC）在ECS服务器挂载SFS Turbo存储在ECS中设置ModelArts用户可读权限安装和配置OBS命令行工具（可选）工作空间配置模型训练：本地构建镜像及调试上传镜像上传数据和算法至SFS（首次使用时需要）

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

购买服务资源（VPC/SFS/OBS/SWR/ECS）配置权限创建专属资源池（打通VPC） ECS服务器挂载SFS Turbo存储在ECS中设置ModelArts用户可读权限安装和配置OBS命令行工具（可选）工作空间配置模型训练：线下容器镜像构建及调试上传镜像上传数据至OBS（首次使用时需要）

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
执行训练任务 - AI开发平台ModelArts

持训练策略类型全参full，配置如下： finetuning_type: full lora，如dpo仅支持此策略；配置如下： finetuning_type: lora lora_target: all lora+，目前仅支持qwen1.5-7B指令监督微调；配置如下： finetuning_type:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
执行训练任务 - AI开发平台ModelArts

说明。 bf16，配置以下参数。 bf16: true fp16，相比bf16还需配置loss scale参数，配置如下。设置fp16为True。 fp16: true 修改deepspeed的"loss_scale"参数，配置如下。修改ZeRO优化器配置文件，如ZeRO2命令如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
同一个账户，图片展示角度不同是为什么？ - AI开发平台ModelArts

同一个账户，图片展示角度不同是为什么？有的图片存在旋转角度等属性，不同的浏览器的处理策略不同，对浏览器的兼容性如表1和表2所示。 L代表last，L3-产品版本上线时最新的3个稳定浏览器版本。如果您当前使用的浏览器版本过低，将在一定程度上影响页面的显示效果，系统会提示您尽快对浏览器进行升级。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
训练精度测试 - AI开发平台ModelArts

<baseline>：<可选>GP-Ant8机器精度基线Yaml文件路径，不填则使用工具自带基线配置，默认基线配置样例如下：客户使用工具自带精度基线Yaml则需使用accuracy_cfgs.yaml文件中默认配置，权重使用表1 模型权重中指定的Huggingface地址，数据指定data.tgz里面提供的gsm8k数据。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
设置训练故障优雅退出 - AI开发平台ModelArts

proto文件生成策略恢复文件。训练脚本根据策略恢复文件，加载临终ckpt进行续训练。在数据并行场景下，也是类似的流程，只是更为简单，无需生成并行策略文件和策略恢复文件，只要保存和加载临终ckpt文件即可。特性使用操作安装优雅退出二进制包通过ma_pre_start.sh安装whl包。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性

总条数： 1355

上一页
1
...
9
10
11
...
68
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用MaaS压缩模型 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练任务 - AI开发平台ModelArts

使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

VS Code中设置远端默认安装的插件 - AI开发平台ModelArts

使用自定义镜像创建在线服务，如何修改默认端口 - AI开发平台ModelArts

管理ModelArts模型版本 - AI开发平台ModelArts

在线服务 - AI开发平台ModelArts

Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

PyCharm ToolKit工具中Edit Credential时，出现错误 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练任务 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

同一个账户，图片展示角度不同是为什么？ - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

设置训练故障优雅退出 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线