搜索_华为云

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

推理业务迁移到昇腾的通用流程，可参考GPU推理业务迁移至昇腾的通用指导。由于Huggingface网站的限制，访问Stable Diffusion链接时需使用代理服务器，否则可能无法访问网站。在Stable Diffusion迁移适配时，更多的时候是在适配Diffusers和Stable Diffusion

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
通过patch操作对服务进行更新 - AI开发平台ModelArts

响应参数状态码： 200 表5 响应Header参数参数参数类型描述 X-Request-Id String 请求链路编号，可用于日志追踪表6 响应Body参数参数参数类型描述 update_time String 本次更新时间，仅触发服务配置升级时会返回，比如修

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
PyCharm Toolkit使用 - AI开发平台ModelArts

path” 使用PyCharm Toolkit提交训练作业报错NoSuchKey 部署上线时，出现错误如何查看PyCharm ToolKit的错误日志如何通过PyCharm ToolKit创建多个作业同时训练？使用PyCharm ToolKit ，提示Error occurs when

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

PyTorch NPU训练指导（6.3.909）场景介绍准备工作执行预训练任务执行SFT全参微调训练任务执行LoRA微调训练任务查看日志和性能训练脚本说明参考常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） - AI开发平台ModelArts

PyTorch NPU训练指导（6.3.908）场景介绍准备工作执行预训练任务执行SFT全参微调训练任务执行LoRA微调训练任务查看日志和性能训练脚本说明参考常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
ModelArts中提示OBS路径错误 - AI开发平台ModelArts

查看OBS桶是否加密检查OBS文件是否为加密文件进入OBS管理控制台，单击桶名称进入概览页。单击左侧菜单栏对象，进入对象列表。单击存放文件的对象名称，并找到具体的文件，可在文件列表的“加密状态”列查看文件是否加密。文件加密无法取消，请先解除桶加密，重新上传图片或文件。检查OBS桶的ACLs设置

 帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
查询DevServer实例详情 - AI开发平台ModelArts

arch String 服务器镜像架构类型。 ARM X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。枚举值如下： BMS：裸金属服务器 ECS：弹性云服务器请求示例 GET h

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
录制Profiling - AI开发平台ModelArts

Torch训练脚本中插入Ascend PyTorch Profiler接口，执行训练的同时采集性能数据，完成训练后直接输出可视化的性能数据文件，提升了性能分析效率。 Ascend PyTorch Profiler接口可全面采集PyTorch训练场景下的性能数据，主要包括PyTor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
管理模型训练作业 - AI开发平台ModelArts

管理模型训练作业查看训练作业详情查看训练作业资源占用情况查看模型评估结果查看训练作业事件查看训练作业日志修改训练作业优先级使用Cloud Shell调试生产训练作业重建、停止或删除训练作业管理训练容器环境变量查看训练作业标签父主题：使用ModelArts Standard训练模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

905-xxx.zip 推理依赖的算子包。模型软件包结构说明本教程需要使用到的AscendCloud-3rdLLM-xxx.zip软件包中的关键文件介绍如下。 ├──llm_tools #推理工具包 ├──llm_evaluation #推理评测代码包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
发布本地AI应用到AI Gallery - AI开发平台ModelArts

当AI应用的状态变为“待启动”时，表示创建完成。启动AI应用上传AI应用的运行文件“app.py”。在AI应用详情页，选择“应用文件”页签，单击“添加文件”，进入上传文件页面。运行文件的开发要求请参见准备AI应用运行文件app.py。上传单个超过5GB的文件时，请使用Gallery CLI工具。CLI工具的获取和使用请参见Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
使用AWQ量化工具转换权重 - AI开发平台ModelArts

AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化，量化方法为per-group。 Step1 模型量化可以在Huggi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
录制Profiling - AI开发平台ModelArts

Torch训练脚本中插入Ascend PyTorch Profiler接口，执行训练的同时采集性能数据，完成训练后直接输出可视化的性能数据文件，提升了性能分析效率。 Ascend PyTorch Profiler接口可全面采集PyTorch训练场景下的性能数据，主要包括PyTor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

规则类型：选择阈值类告警。监控对象：选择命令行输入。命令行输入框： sum(nt_npg{type="NT_NPU_CARD_LOSE"} !=2) by (cluster_name, node_ip,type) 图2 告警规则设置告警条件：选择触发条件在1个监控周期内，如果平均值>=1达到连续1次时，产生重要告警。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
使用AWQ量化 - AI开发平台ModelArts

模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16 per-channel Step1 环境准备在节点自定义目录${node_path}下创建config.yaml文件 apiVersion:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化工具转换权重 - AI开发平台ModelArts

AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel, W8A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
自定义脚本代码示例 - AI开发平台ModelArts

self.label = [0,1,2,3,4,5,6,7,8,9] # 亦可通过文件标签文件加载 # model目录下放置label.json文件，此处读取 dir_path = os.path.dirname(os.path.realpath(self

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用规范参考
查询训练作业列表 - AI开发平台ModelArts

训练作业、算法的规格信息。表28 algorithm 参数参数类型描述 code_dir String 算法启动文件所在目录绝对路径。 boot_file String 算法启动文件绝对路径。 inputs inputs object 算法输入通道信息。 outputs outputs object

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业

总条数： 1323

上一页
1
...
39
40
41
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

PyCharm Toolkit使用 - AI开发平台ModelArts

主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） - AI开发平台ModelArts

ModelArts中提示OBS路径错误 - AI开发平台ModelArts

查询DevServer实例详情 - AI开发平台ModelArts

录制Profiling - AI开发平台ModelArts

管理模型训练作业 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

录制Profiling - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线