搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。在容器中使用ma-user用户运行以下命令下载并安装AutoAWQ源码。 git clone -b v0.2.5 https://github.com/casper-hansen/AutoAWQ.git AutoAWQ-0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

脚本中添加收集Summary相关代码。 TensorFlow引擎的训练脚本中添加Summary代码，具体方式请参见TensorFlow官方网站。注意事项运行中的可视化作业不单独计费，当停止Notebook实例时，计费停止。 Summary文件数据如果存放在OBS中，由OBS单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
离线训练安装包准备说明 - AI开发平台ModelArts

com/ascend/MindSpeed.git cd MindSpeed git checkout 4ea42a23 cd .. 完整的源码目录结构如下： |——AscendCloud-LLM |──llm_train # 模型训练代码包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
使用AWQ量化工具转换权重 - AI开发平台ModelArts

sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。在Notebook中运行以下命令下载并安装AutoAWQ源码。 git clone -b v0.2.5 https://github.com/casper-hansen/AutoAWQ.git AutoAWQ-0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

Studio大模型即服务平台（下面简称为MaaS），使用Qwen2-7B模型可以实现新闻自动分类，能够高效处理和分类大量新闻内容。该解决方案可以应用于如下场景：新闻门户网站：自动将新闻内容归类到相应板块，如科技、体育或国际新闻，以提升用户体验和内容检索效率。社交媒体平台：对用户分享的新闻链接进行智能分类，帮助用户迅速定位到感兴趣的话题。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
Yaml配置文件参数配置说明 - AI开发平台ModelArts

num_train_epochs: 10.0 lr_scheduler_type: cosine warmup_ratio: 0.1 bf16: true flash_attn: sdpa ddp_timeout: 180000000 include_tokens_per_second: true i

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
数据标注场景介绍 - AI开发平台ModelArts

能标注，快速完成剩余图片的标注操作。目前只有“图像分类”和“物体检测”类型的数据集支持智能标注功能。团队标注数据标注任务中，一般由一个人完成，但是针对数据集较大时，需要多人协助完成。ModelArts提供了团队标注功能，可以由多人组成一个标注团队，针对同一个数据集进行标注管理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
使用AWQ量化工具转换权重 - AI开发平台ModelArts

1、在容器中使用ma-user用户， vLLM使用transformers版本与awq冲突，需要切换conda环境，运行以下命令下载并安装AutoAWQ源码。 conda create --name awq --clone PyTorch-2.1.0 conda activate awq pip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

M-x.x.x.zip的llm_tools/AutoAWQ目录下。 1、在容器中使用ma-user用户运行以下命令下载并安装AutoAWQ源码。 cd llm_tools/AutoAWQ bash build.sh 2、运行“examples/quantize.py”文件进行模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

1、在容器中使用ma-user用户， vLLM使用transformers版本与awq冲突，需要切换conda环境，运行以下命令下载并安装AutoAWQ源码。 conda create --name awq --clone PyTorch-2.1.0 conda activate awq pip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

部署上线通常AI模型部署和规模化落地非常复杂。ModelArts支持将训练好的模型一键部署到端、边、云的各种设备上和各种场景上，并且还为个人开发者、企业和设备生产厂商提供了一整套安全可靠的一站式部署方式。在线服务在线推理服务，可以实现高并发，低延时，弹性伸缩，并且支持多模型

 帮助中心 > AI开发平台ModelArts > 功能总览
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

图片大Shape性能劣化严重怎么办？在昇腾设备上，可能由于GPU内存墙导致在大shape下遇到性能问题。MindSporeLite提供了Flash Attention编译优化机制，您可以考虑升级最新版本的MindSporeLite Convertor来进行编译器的算子优化，在大Shape场景下会有明显的改善。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

求请参见安装文件规范。安装文件规范请根据依赖包的类型，在代码目录下放置对应文件：依赖包为开源安装包时暂时不支持直接从github的源码中安装。在“代码目录”中创建一个命名为“pip-requirements.txt”的文件，并且在文件中写明依赖包的包名及其版本号，格式为“包名==版本号”。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
使用AWQ量化工具转换权重 - AI开发平台ModelArts

1、在容器中使用ma-user用户， vLLM使用transformers版本与awq冲突，需要切换conda环境，运行以下命令下载并安装AutoAWQ源码。 conda create --name awq --clone PyTorch-2.1.0 conda activate awq pip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

1、在容器中使用ma-user用户, vLLM使用transformers版本与awq冲突，需要切换conda环境，运行以下命令下载并安装AutoAWQ源码。 conda create --name awq --clone PyTorch-2.1.0 conda activate awq pip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

Spore-Lite迁移路线进行介绍。使用ascend-vllm路线的迁移指导会在后续提供，您可以从上面的案例中下载相关代码并直接参考实现源码。父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用CodeLab免费体验Notebook - AI开发平台ModelArts

Gallery中提供的Notebook样例，可以直接通过Run in ModelArts，一键打开运行和学习，并且可将样例修改后分享到AI Gallery中直接另存用于个人开发。同时，您开发的代码，也可通过CodeLab快速分享到AI Gallery中给他人使用学习。使用限制 CodeLab默认打开，使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
版本说明和要求 - AI开发平台ModelArts

├──llm_inference # 推理代码 ├──ascend_vllm ├── vllm_npu # 推理源码 ├── ascend_vllm-0.6.3-py3-none-any.whl # 推理安装包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
快速配置ModelArts委托授权 - AI开发平台ModelArts

相关介绍请参见创建委托。所有用户：该选项表示会将委托的权限授权到当前账号下的所有子账号、包括未来创建的子账号，授权范围较大，需谨慎使用。个人用户选择“所有用户”即可。 “授权对象” “授权对象类型”选择“所有用户”时不涉及此参数。 IAM子用户：选择指定的IAM子用户，给指定的IAM子用户配置委托授权。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
在推理生产环境中部署推理服务 - AI开发平台ModelArts

sh增加如下环境变量开启高阶配置：配置环境变量。 export USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子（全量prefill阶段的flash-attention）是否使用高精度模式；默认值为1表示开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则精度

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）

总条数： 210

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

数据标注场景介绍 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

版本说明和要求 - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线