搜索_华为云

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 kv-cache-int8是实验特性，在部分场景下性能可能会劣于非量化。当前支持per-tensor静态量化，支持kv-cache-int8量化和FP16、BF16、AWQ、smoothquant的组合。 kv-cache-int8量化支持的模型请参见支持的模型列表和权重文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
推理服务性能评测 - AI开发平台ModelArts

推理服务性能评测语言模型推理性能测试多模态模型推理性能测试父主题：主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
指令监督微调训练任务 - AI开发平台ModelArts

指令监督微调训练任务 Step1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件、自定义数据集，可以忽略此步骤。未上传训练权重文件，具体参考上传代码和权重文件到工作环境。使用自定义数据集训练未上传自定义数据集。具体参考上传自定义数据到指定目录章节并更新dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
执行微调训练任务 - AI开发平台ModelArts

执行微调训练任务 Step1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件、自定义数据集，可以忽略此步骤。未上传训练权重文件，具体参考上传代码和权重文件到工作环境。使用自定义数据集训练未上传自定义数据集。具体参考上传自定义数据到指定目录章节并更新dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误 mc2融合算子报错父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化工具转换权重 AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化，量化方法为per-group。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
使用基础镜像 - AI开发平台ModelArts

使用基础镜像通过ECS获取和上传基础镜像将镜像上传至SWR服务后，可创建训练作业，在“选择镜像”中选择SWR中基础镜像。由于基础镜像内需要安装固定版本依赖包，如果直接使用基础镜像进行训练，每次创建训练作业时，训练作业的图1中都需要执行install.sh文件，来安装依赖以及下载完整代码。命令如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
Workflow多分支运行介绍 - AI开发平台ModelArts

Workflow多分支运行介绍当前支持两种方式实现多分支的能力，条件节点只支持双分支的选择执行，局限性较大，推荐使用配置节点参数控制分支执行的方式，可以在不添加新节点的情况下完全覆盖ConditionStep的能力，使用上更灵活。构建条件节点控制分支执行主要用于执行流程的条件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
投机推理使用说明 - AI开发平台ModelArts

平均可以生成3个有效token，即用1.5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。表1 投机推理相关参数服务启动方式配置项取值类型配置说明 offline speculative_model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
设备属性上报 - 设备接入 IoTDA
设备属性上报 - 设备接入 IoTDA

device_id 是 String Path 参数解释: 设备ID，用于唯一标识一个设备。在注册设备时直接指定，或者由物联网平台分配获得。由物联网平台分配时，生成规则为"product_id" + "_" + "node_id"拼接而成。取值范围: 长度不超过128，只允许字

 帮助中心 > 设备接入 IoTDA > API参考 > 设备侧HTTPS接口参考 > 设备属性上报
服务如何下单？ - 专业服务
服务如何下单？ - 专业服务

服务如何下单？先咨询再下单，支持自行在华为云平台下单或者通过客户经理下单。父主题：关于服务购买

 帮助中心 > 专业服务 > 产品介绍 > 运维与管理 > WeLink运营支撑服务 > 常见问题 > 关于服务购买
服务如何下单？ - 专业服务
服务如何下单？ - 专业服务

服务如何下单？先咨询再下单，支持自行在华为云平台下单或者通过客户经理下单。父主题：关于服务购买

 帮助中心 > 专业服务 > 产品介绍 > 运维与管理 > WeLink运维保障服务 > 常见问题 > 关于服务购买
硬终端怎么自定义会场名？ - 华为云会议 Meeting

硬终端怎么自定义会场名？在“华为云会议管理平台”的“终端管理”中修改该终端的“名称”，重启终端后生效。父主题：硬终端业务使用

 帮助中心 > 华为云会议 Meeting > 常见问题 > 硬终端业务使用
盘古CV大模型能力与规格 - 盘古大模型 PanguLargeModels

Pangu-CV-ObjectDetection-N-2.1.0 2024年12月发布的版本，支持全量微调、在线推理。在选择和使用盘古大模型时，了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型评测、模型压缩、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。以下是盘古CV大模型支持的具体操作：

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
中间件相关 - 智能制造
中间件相关 - 智能制造

中间件相关双网卡、Vmware 说明：软件注册会绑定网卡的MAC地址，所以在有双网卡的或者安装了VMware软件的时候，请确认根据那个网卡注册的。并且双网卡有可能会引起集群失效的问题，建议先关闭一个网卡，注册和配置完毕后再开启。 Tomcat 如果使用tomcat部署，需要修改配置文件server

帮助中心 > 亿信华辰数据中台解决方案实践 > 实施步骤 > ABI一站式数据分析平台 > 疑难问题处理方案
已订购的包年包月计费的ServiceStage按需资源包是否支持变更规格？ - 应用管理与运维平台 ServiceStage

已订购的包年包月计费的ServiceStage按需资源包是否支持变更规格？已订购的包年包月计费的ServiceStage按需资源包，不支持变更规格。但是，您可以根据实际业务需要购买其他规格的ServiceStage资源包，请参考购买资源包。父主题：计费FAQ

帮助中心 > 应用管理与运维平台 ServiceStage > 计费说明 > 计费FAQ

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

推理服务性能评测 - AI开发平台ModelArts

指令监督微调训练任务 - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

Workflow多分支运行介绍 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

设备属性上报 - 设备接入 IoTDA

服务如何下单？ - 专业服务

服务如何下单？ - 专业服务

硬终端怎么自定义会场名？ - 华为云会议 Meeting

盘古CV大模型能力与规格 - 盘古大模型 PanguLargeModels

中间件相关 - 智能制造

已订购的包年包月计费的ServiceStage按需资源包是否支持变更规格？ - 应用管理与运维平台 ServiceStage

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线