搜索_华为云

ECS中构建新镜像 - AI开发平台ModelArts

<镜像仓库地址>/<组织名称>/<镜像名称>:<版本名称> 参数说明： ${dockerfile_image_name}：在step5中，使用Dockerfile创建的新镜像名称。 <镜像仓库地址>：可在SWR控制台上查询，容器镜像服务中登录指令末尾的域名即为镜像仓库地址。 <组织

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

<镜像仓库地址>/<组织名称>/<镜像名称>:<版本名称> 参数说明： ${dockerfile_image_name}：在step5中，使用Dockerfile创建的新镜像名称。 <镜像仓库地址>：可在SWR控制台上查询，容器镜像服务中登录指令末尾的域名即为镜像仓库地址。 <组织

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

准备代码本教程中用到的模型软件包如下表所示，请提前准备好。获取配套版本本方案支持的软件配套版本和依赖包获取地址如表1所示。表1 软件配套版本和获取地址软件名称说明下载地址 AscendCloud-3rdLLM-6.3.905-xxx.zip 说明：软件包名称中的xxx表示时间戳。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
准备镜像环境 - AI开发平台ModelArts

上传到宿主机上，官网下载地址：https://huggingface.co/runwayml/stable-diffusion-v1-5/tree/main 下载stable-diffusion-xl-base-1.0模型包并上传到宿主机上，官网下载地址：https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
准备镜像环境 - AI开发平台ModelArts

上，官网下载地址：https://huggingface.co/benjamin-paine/stable-diffusion-v1-5/tree/main （需登录）下载stable-diffusion-xl-base-1.0模型包并上传到宿主机上，官网下载地址：https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
请求超时返回Timeout - AI开发平台ModelArts

API网关）和模型。处理方法优先排查APIG（API网关）是否是通的，可以在本地使用curl命令排查，命令行：curl -kv {预测地址}。如返回Timeout则需排查本地防火墙，代理和网络配置。检查模型是否启动成功或者模型处理单个消息的时长。因APIG（API网关）的限

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

将为用户提供一个可调用的API，此API为标准Restful API。您可以在服务详情页面，调用指南页签中查看API接口公网地址。图1 API接口公网地址约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
LoRA微调训练 - AI开发平台ModelArts

LoRA微调权重转换 LoRA微调训练前，需要先把训练权重文件转换为Megatron格式。 LoRA微调训练和SFT全参微调使用的是同一个HuggingFace权重文件转换为Megatron格式后的结果也是通用的。如果在SFT微调任务中已经完成了HuggingFace权重转换操作，此处

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
变更计费模式 - AI开发平台ModelArts

变更计费模式变更计费模式概述按需转包年/包月包年/包月转按需

 帮助中心 > AI开发平台ModelArts > 计费说明
LoRA微调训练 - AI开发平台ModelArts

LoRA微调权重转换 LoRA微调训练前，需要先把训练权重文件转换为Megatron格式。 LoRA微调训练和SFT全参微调使用的是同一个HuggingFace权重文件转换为Megatron格式后的结果也是通用的。如果在SFT微调任务中已经完成了HuggingFace权重转换操作，如果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
（可选）配置镜像预热 - AI开发平台ModelArts

镜像预热参数参数名称说明镜像来源可选择“预置”或“自定义”的镜像。预置：可选择SWR服务上自有的或他人共享的镜像。自定义：可直接填写镜像地址。添加镜像密钥若本租户不具有预热的镜像的权限（即非公开/非本租户私有/非他人共享的镜像），此时需要添加镜像密钥。在开启镜像密钥开关后，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
SFT全参微调任务 - AI开发平台ModelArts

处理，具体参见SFT全参微调数据处理。原始的HuggingFace权重，已将原始的HuggingFace权重转换为Megatron格式，具体参见SFT全参微调权重转换 Step2 启动训练脚本单机启动以baichuan2-13b为例，单机SFT全参微调启动命令如下。进入代码

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调
Wav2Lip基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

音驱动的人脸说话视频生成模型。主要应用于数字人场景。不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频，还可以直接将动态的视频进行唇形转换，输出与输入语音匹配的视频，俗称“对口型”。该技术的主要作用就是在将音频与图片、音频与视频进行合成时，口型能够自然。方案概览本方案介绍

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

音驱动的人脸说话视频生成模型。主要应用于数字人场景。不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频，还可以直接将动态的视频进行唇形转换，输出与输入语音匹配的视频，俗称“对口型”。该技术的主要作用就是在将音频与图片、音频与视频进行合成时，口型能够自然。方案概览本方案介绍

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
LoRA微调训练 - AI开发平台ModelArts

LoRA微调权重转换 LoRA微调训练前，需要先把训练权重文件转换为Megatron格式。 LoRA微调训练和SFT全参微调使用的是同一个HuggingFace权重文件转换为Megatron格式后的结果也是通用的。如果在SFT微调任务中已经完成了HuggingFace权重转换操作，此处

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

PU上进行模型转换时无需考虑动态shape问题，因为CPU算子支持动态shape；而在Ascend场景上，算子需要指定具体的shape信息，并且在模型转换的编译阶段完成对应shape的编译任务，从而能够在推理时支持多种shape的输入。动态batch 在模型转换阶段通过--co

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
自定义镜像使用场景 - AI开发平台ModelArts

杂的环境依赖需要进行调测并固化。面对开发中的开发环境的脆弱和多轨切换问题，在ModelArts的AI开发最佳实践中，通过容器镜像的方式将运行环境进行固化，以这种方式不仅能够进行依赖管理，而且可以方便的完成工作环境切换。配合ModelArts提供的云化容器资源使用，可以更加快速、高效的进行AI开发与模型实验的迭代等。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
LoRA微调训练 - AI开发平台ModelArts

LoRA微调权重转换 LoRA微调训练前，需要先把训练权重文件转换为Megatron格式。 LoRA微调训练和SFT全参微调使用的是同一个HuggingFace权重文件，转换为Megatron格式后的结果也是通用的。如果在SFT微调任务中已经完成了HuggingFace权重转换操作，此

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
包年/包月转按需 - AI开发平台ModelArts

图2 单个资源转按需批量资源到期转按需：选择需要更改计费模式的实例，单击列表左上角的“到期转按需”。查看资费变更的相关信息后，单击“到期转按需”。父主题：变更计费模式

 帮助中心 > AI开发平台ModelArts > 计费说明 > 变更计费模式
精度问题处理 - AI开发平台ModelArts

精度问题处理设置高精度并重新转换模型在转换模型时，默认采用的精度模式是fp16，如果转换得到的模型和标杆数据的精度差异比较大，可以使用fp32精度模式提升模型的精度（精度模式并不总是需要使用fp32，因为相对于fp16，fp32的性能较差。因此，通常只在检测到某个模型精度存在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优

总条数： 707

上一页
1
...
7
8
9
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

请求超时返回Timeout - AI开发平台ModelArts

通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

变更计费模式 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

（可选）配置镜像预热 - AI开发平台ModelArts

SFT全参微调任务 - AI开发平台ModelArts

Wav2Lip基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

自定义镜像使用场景 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

包年/包月转按需 - AI开发平台ModelArts

精度问题处理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线