搜索_华为云

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度，不代表最佳性能。以llama2-13b为例，NPU卡显存为32GB时，至少需要2张卡运行推理业务，2张卡运行的情况下，推荐的最大序列max-model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

rch NPU的Finetune高性能训练指导 SDXL基于DevServer适配PyTorch NPU的Finetune高性能训练指导 SDXL基于DevServer适配PyTorch NPU的LoRA训练指导 Open-Sora基于DevServer适配PyTorch NPU训练指导

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
推理模型量化 - AI开发平台ModelArts

推理模型量化使用AWQ量化使用SmoothQuant量化使用kv-cache-int8量化父主题：主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
训练脚本说明 - AI开发平台ModelArts

训练启动脚本说明和参数配置训练的数据集预处理说明训练中的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
配额与限制 - AI开发平台ModelArts

服务资源类型 ECS资源类型 ECS实例数 CPU核心数 RAM容量（MB）弹性公网IP EIP资源伸缩带宽策略云硬盘EVS SFS资源磁盘数磁盘容量（GB）快照数弹性文件服务SFS资源容量配额

 帮助中心 > AI开发平台ModelArts > 产品介绍
如何在容器中安装依赖包 - AI开发平台ModelArts

包。 pip install -r requirements.txt 安装成功后的示意图如图1所示。图1 依赖包安装成功父主题：常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 常见问题
训练脚本说明 - AI开发平台ModelArts

训练启动脚本说明和参数配置训练的数据集预处理说明训练中的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.907）训练场景和方案介绍准备镜像环境 Finetune训练 LoRA训练父主题： AIGC模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
JupyterLab默认工作路径是什么？ - AI开发平台ModelArts

upyterLab上传下载功能。带EVS存储的Notebook实例 JupyterLab文件默认存储路径，为创建Notebook实例时，系统自动分配的EVS空间。在文件列表的所有文件读写操作都是基于所选择的EVS下的内容操作的。使用EVS类型的挂载，可将大数据挂载至“~/work”目录下。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
计费相关 - AI开发平台ModelArts
计费相关 - AI开发平台ModelArts

为什么项目删除完了，仍然还在计费？欠费后，ModelArts的资源是否会被删除？部署后的AI应用是如何收费的？ Notebook中的EVS存储可以使用套餐包吗？

帮助中心 > AI开发平台ModelArts > 常见问题
欠费说明 - AI开发平台ModelArts
欠费说明 - AI开发平台ModelArts

对于包年/包月专属资源池，用户已经预先支付了资源费用，因此在账户出现欠费的情况下，已有的包年/包月专属资源池仍可正常使用。然而，对于涉及费用的操作，如将数据存储至OBS或EVS、续费订单等，用户将无法正常进行。按需计费当您的账号因按需资源自动扣费导致欠费后，账号将变成欠费状态。欠费后，按需资源不会立即停止服务

 帮助中心 > AI开发平台ModelArts > 计费说明
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

同时利用昇腾高性能算子库Ascend Transformer Boost（ATB）和适配昇腾平台的大模型推理服务Text Generation Inference（TGI） + 华为自研Ascend Snt9b硬件，为用户提供了开箱即用的推理部署方案，包括推理的性能和精度测试等，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） - AI开发平台ModelArts

GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练推理前的权重合并转换父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
一般性问题 - AI开发平台ModelArts

一般性问题什么是ModelArts ModelArts与其他服务的关系 ModelArts与DLS服务的区别？如何购买或开通ModelArts？支持哪些型号的Ascend芯片？如何获取访问密钥？如何上传数据至OBS？提示“上传的AK/SK不可用”，如何解决？使用Mo

帮助中心 > AI开发平台ModelArts > 常见问题
配置Lite Cluster存储 - AI开发平台ModelArts

分析工作负载程序等。 SFS容量型文件系统不适合海量小文件业务。静态挂载动态挂载 EVS 适用于Notebook场景，开发过程的数据持久化。每个云盘只能在单个节点挂载。存储大小根据云硬盘的大小而定。静态挂载动态挂载父主题： Lite Cluster资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） - AI开发平台ModelArts

Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）场景介绍准备工作预训练 SFT全参微调 LoRA微调训练推理前的权重合并转换父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） - AI开发平台ModelArts

LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练推理前的权重合并转换父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备数据准备镜像父主题： LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备数据准备镜像父主题： GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、性能查看。微调训练 SFT全参微调介绍如何进行SFT全参微调、超参配置、训练任务、性能查看。 LoRA微调训练介绍如何进行LoRA微调、超参配置、训练任务、性能查看。父主题：主流开源大模型基于DevServer适配PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）

总条数： 1439

上一页
1
...
7
8
9
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

推理模型量化 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

配额与限制 - AI开发平台ModelArts

如何在容器中安装依赖包 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

JupyterLab默认工作路径是什么？ - AI开发平台ModelArts

计费相关 - AI开发平台ModelArts

欠费说明 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） - AI开发平台ModelArts

一般性问题 - AI开发平台ModelArts

配置Lite Cluster存储 - AI开发平台ModelArts

Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） - AI开发平台ModelArts

LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线