检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
执行训练任务 执行训练任务【新】 执行训练任务【旧】 父主题: 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导(6.5.901)
分离部署 PD分离部署使用说明 PD分离部署性能调优理论基础 PD分离部署手动配比调优(推荐) PD分离部署自动配比调优 PD分离性能调优工具使用说明 父主题: 推理关键特性使用
准备工作 准备环境 准备代码 准备数据 准备镜像 父主题: Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导(6.3.904)
投机推理 投机推理使用说明 Eagle投机小模型训练 父主题: 推理关键特性使用
SFT全参微调 SFT全参微调数据处理 SFT全参微调权重转换 SFT全参微调超参配置 SFT全参微调任务 父主题: Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导(6.3.904)
GLM3-6B模型基于DevServer适配PyTorch NPU训练指导(6.3.904) 场景介绍 准备工作 预训练 SFT全参微调训练 LoRA微调训练 推理前的权重合并转换 父主题: LLM大语言模型训练推理
训练评测 工具介绍及准备工作 训练性能测试 训练精度测试 父主题: 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导(6.5.901)
推理关键特性使用 量化 剪枝 分离部署 Prefix Caching multi-step 投机推理 图模式 多模态 Chunked Prefill multi-lora guided-decoding 父主题: 主流开源大模型基于Lite Server适配Ascend-vLLM
主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导(6.5.901) 场景介绍 准备工作 执行训练任务 查看日志和性能 训练评测 训练脚本说明参考 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
常见错误原因和解决方法 显存溢出错误 网卡名称错误 工作负载Pod异常 mc2融合算子报错 父主题: 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导(6.5.901)
主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导(6.5.901) 场景介绍 准备工作 执行训练任务 查看日志和性能 训练benchmark工具 训练脚本说明 附录:训练常见问题 父主题: LLM大语言模型训练推理
附录 各模型支持的最小卡数和最大序列 Ascend-vLLM推理常见问题 父主题: 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导(6.5.901)
主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导(6.5.901) 场景介绍 准备工作 训练任务 查看日志和性能 训练脚本说明参考 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
GPU业务迁移至昇腾训练推理 ModelArts昇腾迁移调优工具总览 GPU训练业务迁移至昇腾的通用指导 基于AIGC模型的GPU推理业务迁移至昇腾指导 GPU推理业务迁移至昇腾的通用指导 基于advisor的昇腾训练性能自助调优指导 Dit模型PyTorch迁移与精度性能调优 msprobe工具使用指导
GPU训练业务迁移至昇腾的通用指导 训练业务迁移到昇腾设备场景介绍 训练迁移快速入门案例 PyTorch迁移精度调优 PyTorch迁移性能调优 训练网络迁移总结 父主题: GPU业务迁移至昇腾训练推理
训练脚本说明 训练启动脚本说明和参数配置 训练数据集预处理说明 训练权重转换说明 训练tokenizer文件说明 父主题: 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.907)
主流开源大模型基于Lite Server适配PyTorch NPU推理指导(6.3.906) 推理场景介绍 部署推理服务 推理性能测试 推理精度测试 推理模型量化 附录:大模型推理常见问题 父主题: LLM大语言模型训练推理
准备工作 准备资源 准备数据 准备权重 准备代码 准备镜像 准备Notebook 父主题: 主流开源大模型基于Standard适配PyTorch NPU训练指导(6.3.905)
准备工作 准备资源 准备权重 准备代码 准备镜像 准备Notebook 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.905)
主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.906) 场景介绍 准备工作 在Notebook调试环境中部署推理服务 在推理生产环境中部署推理服务 推理精度测试 推理性能测试 推理模型量化 父主题: LLM大语言模型训练推理