搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。 AutoAWQ量化工具的适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/AutoAWQ目录下。 1、使用该量化工具，需要切换conda环境，运行以下命令。 conda activate

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
成本管理 - AI开发平台ModelArts
成本管理 - AI开发平台ModelArts

成本管理成本构成 ModelArts提供AI工具链、AI算力，成本由AI算力的资源成本和运维成本构成。成本分配 ModelArts支持企业项目管理，可以由企业项目服务来管理同一账号下不同项目的成本。成本分析通过华为云费用账单来分析账号下的成本支出情况。成本优化长期使用

 帮助中心 > AI开发平台ModelArts > 计费说明
查询数据处理任务的版本列表 - AI开发平台ModelArts

path String 工作路径。可选值如下：如果type是OBS，source为OBS路径。如果type是DATASET，source为数据集ID。 type String 工作路径的类型。可选值如下： OBS：OBS路径 DATASET：数据集 version_id String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询处理任务列表 - AI开发平台ModelArts

path String 工作路径。可选值如下：如果type是OBS，source为OBS路径。如果type是DATASET，source为数据集ID。 type String 工作路径的类型。可选值如下： OBS：OBS路径 DATASET：数据集 version_id String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建数据处理任务版本 - AI开发平台ModelArts

否 String 工作路径。可选值如下：如果type是OBS，source为OBS路径。如果type是DATASET，source为数据集ID。 type 否 String 工作路径的类型。可选值如下： OBS：OBS路径 DATASET：数据集 version_id 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用AWQ量化 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

解和计划，再使用工具。每次回复都必须包含对用户的清晰解释。图2 输入提示词在“编排”页面的“工具”区域右侧，单击“添加”，按需添加工具并与模型进行对话调用。 Dify内置有丰富的插件，同时支持自定义工具的创建。图3 添加工具父主题：通过Function Calling扩展大语言模型交互能力

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
查看训练作业日志 - AI开发平台ModelArts

Ascend训练场景下，当训练进程退出后，ModelArts会上传训练容器中的日志文件至“作业日志路径” 参数设置的OBS目录中。在作业详情页可以获取“作业日志路径”，单击OBS地址可以直接跳转到OBS控制台查看日志。图3 日志存放路径您可以通过ma-pre-start脚本修改默认环境变量配置。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
创建自动模型优化的训练作业 - AI开发平台ModelArts

上传至OBS目录。请准备好训练脚本，并上传至OBS目录。训练脚本开发指导参见开发用于预置框架训练的代码。在训练代码中，用户需打印搜索指标参数。已在OBS创建至少1个空的文件夹，用于存储训练输出的内容。由于训练作业运行需消耗资源，确保账户未欠费。确保您使用的OBS目录与ModelArts在同一区域。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
创建导入任务 - AI开发平台ModelArts

String 数据来源。可选值如下： obs：OBS桶（默认值） dws：GaussDB(DWS)服务 dli：DLI服务 rds：RDS服务 mrs：MRS服务 inference：推理服务 import_path 是 String 导入的OBS路径或manifest路径。导入m

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
录制Profiling - AI开发平台ModelArts

录制Profiling Ascend PyTorch Profiler是针对PyTorch框架开发的性能数据采集和解析工具，通过在PyTorch训练脚本中插入Ascend PyTorch Profiler接口，执行训练的同时采集性能数据，完成训练后直接输出可视化的性能数据文件，提升了性能分析效率。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

名及其版本号，格式为“包名==版本号”。例如，“代码目录”对应的OBS路径下，包含模型文件，同时还存在“pip-requirements.txt”文件。“代码目录”的结构如下所示： |---模型启动文件所在OBS文件夹 |---model.py

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
使用AWQ量化 - AI开发平台ModelArts

5-72B-Chat-AWQ 参数说明： model：模型路径。 Step4 启动AWQ量化服务参考部署推理服务，使用量化后权重部署AWQ量化服务。注：Step3 创建服务启动脚本启动脚本中，服务启动命令需添加如下命令。 -q awq 或者--quantization awq 父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

5-72B-Chat-AWQ 参数说明： model：模型路径。 Step4 启动AWQ量化服务参考部署推理服务，使用量化后权重部署AWQ量化服务。注：Step3 创建服务启动脚本启动脚本中，服务启动命令需添加如下命令。 -q awq 或者--quantization awq 父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
查询服务监控信息 - AI开发平台ModelArts

查询服务监控信息查询当前服务对象监控信息。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。方式1：根据部署在线服务生成的服务对象进行查询服务监控 1 2 3 4 5 6 7 from

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

“打开”，打开Notebook实例。 ModelArts Lite DevServer 开通裸金属服务器资源请见DevServer资源开通，在裸金属服务器上搭建迁移环境请见裸金属服务器环境配置指导。父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
推理模型量化 - AI开发平台ModelArts

推理模型量化使用AWQ量化工具转换权重使用SmoothQuant量化工具转换权重使用kv-cache-int8量化父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
推理模型量化 - AI开发平台ModelArts

推理模型量化使用AWQ量化工具转换权重使用SmoothQuant量化工具转换权重使用kv-cache-int8量化父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
Lite Server资源配置流程 - AI开发平台ModelArts

et通信。在后续配置存储和软件环境时需要Server服务器能够访问网络，因此需要先完成网络配置。 2 配置Lite Server存储 Server资源需要挂载数据盘用于存储数据文件，当前支持SFS、OBS、EVS三种云存储服务，提供了多种场景下的存储解决方案。 3 配置Lite Server软件环境

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置

总条数： 1993

上一页
1
...
41
42
43
...
100
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

成本管理 - AI开发平台ModelArts

查询数据处理任务的版本列表 - AI开发平台ModelArts

查询处理任务列表 - AI开发平台ModelArts

创建数据处理任务版本 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

创建自动模型优化的训练作业 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

录制Profiling - AI开发平台ModelArts

训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

推理模型量化 - AI开发平台ModelArts

推理模型量化 - AI开发平台ModelArts

Lite Server资源配置流程 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线