搜索_华为云

使用kv-cache-int8量化 - AI开发平台ModelArts

0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0.9.0。执行如下脚本进行权重转换生成量化系数，详细参数解释请参见https://github.com/NVIDIA/TensorR

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"Brainstorming" } 如果用户希望将 MOSS 数据集的 Excel 格式转换为，json 格式。可使用代码中提供的 scripts/tools/ExcelToJson.py 工具，其转换的要求为：本脚本可以处理的格式有：.xls .xlsx .csv .xlsb .xlsm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

llama2-70b https://huggingface.co/meta-llama/Llama-2-70b-hf https://huggingface.co/meta-llama/Llama-2-70b-chat-hf (推荐) 4 llama3 llama3-8b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
昇腾迁移快速入门案例 - AI开发平台ModelArts

克隆ModelArts Ascend代码库。新建Terminal，执行下述命令将对应的repo克隆到Notebook实例。 git clone https://gitee.com/ModelArts/modelarts-ascend.git 图5 下载示例代码昇腾迁移案例在“~/work

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

方法一：检查VS Code网络是否正常。在VS Code插件市场上搜索ModelArts-HuaweiCloud，若显示如下则网络异常，请切换代理或使用其他网络。操作完成后再次执行搜索，若显示如下则网络正常，请回到ModelArts控制台界面再次单击界面上的“VS Code接入”按钮。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用kv-cache-int8量化 - AI开发平台ModelArts

llama/convert_checkpoint.py。执行convert_checkpoint.py脚本进行权重转换生成量化系数，详细参数解释请参见https://github.com/NVIDIA/TensorRT-LLM/tree/main/examples/llama#int8-kv-cache。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

√ √ https://huggingface.co/meta-llama/Llama-2-13b-chat-hf 6 llama2-70b √ √ √ √ √ https://huggingface.co/meta-llama/Llama-2-70b-hf https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

"nvidia-container-runtime", "runtimeArgs": [] } } } 重启Docker daemon： sudo systemctl restart docker 3、运行DCGM-Exporter 以Docker方式运行DCGM-Exporter：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Service）作为存储的方案，OBS用于存储模型文件、训练数据、代码、日志等，提供了高可靠性的数据存储解决方案。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格，只有llama3-8B/70B支持该功能。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持以下模型的训练，如表1所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

png' -X POST http://127.0.0.1:8080/ 图9 预测在调试过程中，如果有修改模型文件或者推理脚本文件，需要重启run.sh脚本。执行如下命令先停止nginx服务，再运行run.sh脚本。 #查询nginx进程 ps -ef |grep nginx

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

方法一：检查VS Code网络是否正常。在VS Code插件市场上搜索ModelArts-HuaweiCloud，如果显示如下则网络异常，请切换代理或使用其他网络。操作完成后再次执行搜索，若显示如下则网络正常，请回到ModelArts控制台界面再次单击界面上的“VS Code接入”按钮。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
训练作业性能降低 - AI开发平台ModelArts

训练作业性能降低问题现象使用ModelArts平台训练算法训练耗时增加。原因分析可能存在如下原因：平台上的代码经过修改优化、训练参数有过变更。训练的GPU硬件工作出现异常。处理方法请您对作业代码进行排查分析，确认是否对训练代码和参数进行过修改。检查资源分配情况（cpu/

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业性能问题
是否支持在CodeLab中使用昇腾的卡进行训练？ - AI开发平台ModelArts

Gallery社区的Notebook案例，使用的资源是ASCEND的，“Run in ModelArts”跳转到CodeLab，就可以使用昇腾卡进行训练。也支持切换规格父主题： CodeLab

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > CodeLab
单模型性能调优AOE - AI开发平台ModelArts

对text_encoder等模型提升效果不大，性能主要瓶颈点在unet模型中，主要对unet模型做调优，整体的操作步骤如下：转换前先清理缓存，避免转换时的影响。 #shell # 删除已有的aoe知识库，或者备份一份 rm -rf /root/Ascend/latest/data/aoe

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
ModelArts计费模式概述 - AI开发平台ModelArts

自动学习、Workflow、Notebook、模型训练、服务部署变更计费模式支持变更为按需计费模式。但包年/包月资费模式到期后，按需的资费模式才会生效。包年/包月转按需支持变更为包年/包月计费模式。按需转包年/包月变更规格支持变更实例规格。支持变更实例规格。适用场景适用于可预估资源使

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Service）作为存储的方案，OBS用于存储模型文件、训练数据、代码、日志等，提供了高可靠性的数据存储解决方案。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格，只有llama3-8B/70B支持该功能。适配的CANN版本是cann_8.0.rc3，驱动版本是23.0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
准备Notebook（可选） - AI开发平台ModelArts

Arts Notebook的详细资料请查看开发环境介绍。本案例中，如果用户需要自定义开发，可通过Notebook环境进行数据预处理、权重转换等操作。并且Notebook环境具有一定的存储空间，可与OBS中的数据相互传递。创建Notebook 创建开发环境Notebook实例，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
迁移过程使用工具概览 - AI开发平台ModelArts

模型转换工具离线转换模型功能的工具MSLite Convertor，支持onnx、pth、tensorflowLite多种类型的模型转换，转换后的模型可直接运行在MindSpore运行时后端，用于昇腾推理。精度性能检查工具 Benchmark精度检查工具，可以转换模型后执行推理前，使用其对MindSpore

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
推理模型量化 - AI开发平台ModelArts

推理模型量化使用AWQ量化工具转换权重使用SmoothQuant量化工具转换权重使用kv-cache-int8量化使用GPTQ量化父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

总条数： 618

上一页
1
...
10
11
12
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用kv-cache-int8量化 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

昇腾迁移快速入门案例 - AI开发平台ModelArts

在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

训练作业性能降低 - AI开发平台ModelArts

是否支持在CodeLab中使用昇腾的卡进行训练？ - AI开发平台ModelArts

单模型性能调优AOE - AI开发平台ModelArts

ModelArts计费模式概述 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备Notebook（可选） - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

推理模型量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线