搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

运行完成后，会在output_dir下生成量化后的权重。量化后的权重包括原始权重和kvcache的scale系数。抽取kv-cache量化系数。该步骤的目的是将步骤1中生成的scale系数提取到单独文件中，供推理时使用。使用的抽取脚本由vllm社区提供： python3 e

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
LoRA微调训练 - AI开发平台ModelArts

训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细了解脚本执行训练权重转换操作和数据集预处理操作说明请分别参见训练中的权重转换说明和训练的数据集预处理说明。步骤二修改训练超参配置以Llama2-70b和Llama2-13b的LoRA微调为例，执行脚本为0_pl_lora_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）
SFT全参微调训练任务 - AI开发平台ModelArts

训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细了解脚本执行训练权重转换操作和数据集预处理操作说明请分别参见训练中的权重转换说明和训练的数据集预处理说明。步骤二修改训练超参配置以Llama2-70b和Llama2-13b的SFT微调为例，执行脚本为0_pl_sft_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）
查看批量服务详情 - AI开发平台ModelArts

说明事件展示当前服务使用过程中的关键操作，比如服务部署进度、部署异常的详细原因、服务被启动、停止、更新的时间点等。事件保存周期为1个月，1个月后自动清理数据。查看服务的事件类型和事件信息，请参见查看在线服务的事件日志展示当前服务下每个模型的日志信息。包含最近5分钟、最近30分钟、最近1小时和自定义时间段。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
创建数据集 - AI开发平台ModelArts

表2 数据集输入位置，用于将此目录及子目录下的源数据(如图片/文件/音频等)同步到数据集。对于表格数据集，该参数为导入目录。表格数据集的工作目录不支持为KMS加密桶下的OBS路径。 work_path 是表6 数据集输出位置，用于存放输出的标注信息等文件。 labels 否 List

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
创建数据集标签 - AI开发平台ModelArts

@modelarts:color 否 String 内置属性：标签展示的颜色，为色彩的16进制代码，默认为空。例如：“#FFFFF0”。 @modelarts:default_shape 否 String 内置属性：物体检测标签的默认形状（物体检测标签专用属性），默认为空。可选值如下： bndbox：矩形。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量删除标签 - AI开发平台ModelArts

是否必选参数类型描述 delete_policy 否 Integer 是否删除标签及包含标签的样本。可选值如下： 0：只删除标签 1：删除标签及包含标签的样本 2：删除标签和包含标签的样本及其源文件请求参数表3 请求Body参数参数是否必选参数类型描述 labels

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
安装Gallery CLI配置工具 - AI开发平台ModelArts

Gallery，单击右上角“我的Gallery”进入我的Gallery页面。左侧菜单栏选择“我的资源 > 云服务器”，单击专属资源池页签进入云服务详情页面。在节点页签，单击选择“配置工具”，弹出该节点的配置工具页面。在配置工具页面，单击“下载”启动下载任务。当配置工具的状态记录中“工具状

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
批量修改标签 - AI开发平台ModelArts

@modelarts:color 否 String 内置属性：标签展示的颜色，为色彩的16进制代码，默认为空。例如：“#FFFFF0”。 @modelarts:default_shape 否 String 内置属性：物体检测标签的默认形状（物体检测标签专用属性），默认为空。可选值如下： bndbox：矩形。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
资源池统计 - AI开发平台ModelArts

Integer 创建成功的资源池数量。 failed Integer 最近三天内创建失败的资源池数量，最大值为500。 pending Integer 等待中的资源池数量，通常是未支付的包周期资源池。状态码： 500 表6 响应Body参数参数参数类型描述 error_code

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
SFT全参微调训练 - AI开发平台ModelArts

在“输出”的输入框内设置变量：OUTPUT。 OUTPUT：训练完成后指定的输出模型的路径/standard-qwenvl-7b/output/。在OBS桶中新建一个output目录，用于训练的输出路径。分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）
LoRA微调训练 - AI开发平台ModelArts

在“输出”的输入框内设置变量：OUTPUT。 OUTPUT：训练完成后指定的输出模型的路径/standard-qwenvl-7b/output/。在OBS桶中新建一个output目录，用于训练的输出路径。分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
查询团队标注任务统计信息 - AI开发平台ModelArts

Pair的key为难例原因出现的次数，Pair的value为难例原因HardDetail。 key_sample_stats Map<String,Integer> 难例统计信息。 label_stats Array of LabelStats objects 标签统计信息列表。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

删除开发环境实例，删除的资源包括Notebook容器以及对应的所有存储资源。通过运行的实例保存成容器镜像运行的实例可以保存成容器镜像，保存的镜像中，安装的依赖包（pip包）不丢失，VSCode远程开发场景下，在Server端安装的插件不丢失。查询支持的有效规格列表查询支持的有效规格列表。

帮助中心 > AI开发平台ModelArts > API参考
使用MoXing复制数据报错 - AI开发平台ModelArts

进入ModelArts管理控制台，查看其所在区域。然后再进入OBS管理控制台，查看您使用的OBS桶所在的区域。查看是否在同一区域。是，请执行3。否，请在ModelArts同一区域的OBS中新建桶和文件夹，并将所需的数据上传至此OBS桶中。检查OBS的路径是否正确，是否写为了“obs://xxx”。可使用如下方式判断OBS路径是否存在。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
重置AppSecret - AI开发平台ModelArts

重置AppSecret 功能介绍重置指定API网关应用的AppSecret，只有APP的创建用户才可以重置AppSecret。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
附录：config.json文件 - AI开发平台ModelArts

config.json文件用于推理服务启动时，需要修改以下参数，4台机器的每个容器中config.json文件内容一致。 ipAddress：主节点IP地址，即rank_table_file.json文件中的server_id。 managementIpAddress：主节点IP地址，和ipAddress取值一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导

总条数： 2007

上一页
1
...
96
97
98
...
101
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

查看批量服务详情 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

创建数据集标签 - AI开发平台ModelArts

批量删除标签 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

批量修改标签 - AI开发平台ModelArts

资源池统计 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

使用MoXing复制数据报错 - AI开发平台ModelArts

重置AppSecret - AI开发平台ModelArts

附录：config.json文件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线