搜索_华为云

使用GPTQ量化 - AI开发平台ModelArts

accelerate optimum transformers 设置GPTQConfig的参数，并且创建一个数据集用于校准量化的权重，以及一个tokenizer用于准备数据集。 from transformers import AutoModelForCausalLM, AutoTokenizer

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

accelerate optimum transformers 设置GPTQConfig的参数，并且创建一个数据集用于校准量化的权重，以及一个tokenizer用于准备数据集。 from transformers import AutoModelForCausalLM, AutoTokenizer

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

accelerate optimum transformers 设置GPTQConfig的参数，并且创建一个数据集用于校准量化的权重，以及一个tokenizer用于准备数据集。 from transformers import AutoModelForCausalLM, AutoTokenizer

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
自动学习模型训练图片异常？ - AI开发平台ModelArts

自动学习模型训练图片异常？使用自动学习的图像分类或物体检测算法时，标注完成的数据在进行模型训练后，训练结果为图片异常。针对不同的异常情况说明及解决方案参见表1。表1 自动学习训练中图片异常情况说明（图像分类和物体检测）序号图片异常显示字段图片异常说明解决方案字段解决方案说明

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

且不支持修改。准备数据本地上传数据需要确保数据已按照数据集要求完成编排。如果是自定义模型，此处的数据集要求即为模型文件“dataset_readme.md”里的内容。单个文件最大5GB，所有文件总大小不超过50G。在微调工作流的“数据准备”环节选择数据集。从本地上传在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
在线服务预测报错DL.0105 - AI开发平台ModelArts

0105，报错日志：“TypeError:‘float’object is not subscriptable”。原因分析根据报错日志分析，是因为一个float数据被当做对象下标访问了。处理方法将模型推理代码中的x[0][i]修改为x[i]，重新部署服务进行预测。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
什么是Workflow - AI开发平台ModelArts

要可以定义为四个步骤：项目设计、数据工程、模型构建、部署落地。AI开发并不是一个单向的流水线作业，在开发的过程中，会根据数据和模型结果进行多轮的实验迭代。算法工程师会根据数据特征以及数据的标签做多样化的数据处理以及多种模型优化，以获得在已有的数据集上更好的模型效果。传统的AI应用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

该指标用于统计每秒从磁盘读出的数据量。只考虑被容器使用的数据盘。千字节/秒（Kilobytes/Second） ≥0 磁盘写入速率 ma_node_disk_write_rate_kilobytes_seconds 该指标用于统计每秒写入磁盘的数据量。只考虑被容器使用的数据盘。千字节/秒（Kilobytes/Second）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
Huggingface缓存目录空间不足，出现OSError: [Errno 122] Disk quota exceeded - AI开发平台ModelArts

exceeded 问题现象报错提示OSError: [Errno 122] Disk quota exceeded。原因分析默认情况下，下载数据集缓存目录为“~/.cache/huggingface/dataset”，Huggingface缓存目录空间不足导致出现该报错。处理方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导 > 常见问题
附录：微调训练常见问题 - AI开发平台ModelArts

export PYTORCH_NPU_ALLOC_CONF = expandable_segments:True 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

'feat_2': 'feat_2:0', 'feat_3': 'feat_3:0'} 不做数据集切分操作。如果选择未切分的数据集，算法将做纯训练场景；父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
Lite Cluster高危操作一览表 - AI开发平台ModelArts

Cluster资源时，可能会导致资源池部分功能异常。下表可帮助您定位异常出现的原因，风险操作包括但不限于以下内容。高危操作风险等级说明：高：对于可能直接导致业务失败、数据丢失、系统不能维护、系统资源耗尽的高危操作。中：对于可能导致安全风险及可靠性降低的高危操作。低：高、中风险等级外的其他高危操作。表1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
开发环境提示空间不足，如何解决？ - AI开发平台ModelArts

当提示空间不足时，推荐使用EVS类型的Notebook实例。参考如何在Notebook中上传下载OBS文件？操作指导，针对原有的Notebook，首先将代码和数据上传至OBS桶中。然后创建一个EVS类型的Notebook，将此OBS中的文件下载至Notebook本地（指新建的EVS类型Notebook）。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
什么是自动学习？ - AI开发平台ModelArts

什么是自动学习？自动学习功能可以根据标注的数据自动设计模型、自动调参、自动训练、自动压缩和部署模型，不需要代码编写和模型开发经验。自动学习功能主要面向无编码能力的用户，其可以通过页面的标注操作，一站式训练、部署，完成AI模型构建。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 功能咨询
开发环境提示空间不足，如何解决？ - AI开发平台ModelArts

当提示空间不足时，推荐使用EVS类型的Notebook实例。参考如何在Notebook中上传下载OBS文件？操作指导，针对原有的Notebook，首先将代码和数据上传至OBS桶中。然后创建一个EVS类型的Notebook，将此OBS中的文件下载至Notebook本地（指新建的EVS类型Notebook）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
附录：训练常见问题 - AI开发平台ModelArts

export PYTORCH_NPU_ALLOC_CONF = expandable_segments:True 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
NPU_Flash_Attn融合算子约束 - AI开发平台ModelArts

`disable_gradient_checkpointing: true` 关闭，但显存占用会直线上升。 attn_mask 只支持布尔（bool）数据类型，或者为None。 query的shape仅支持 [B, N1, S1, D]，其中N1≤ 2048，D≤ 512并且dim== 4。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

GLM3-6B ├── data #预处理后数据 ├── pretrain #预训练加载的数据 ├── finetune #微调加载的数据 ├──converted_weights #Hugging

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
日志提示Compile graph failed - AI开发平台ModelArts

日志提示：Compile graph failed。图1 报错提示原因分析模型转换时未指定Ascend后端。处理方法需要在模型转换阶段指定“--device=Ascend”。父主题：常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 常见问题
自定义模型规范 - AI开发平台ModelArts

例请参见train_params.json示例。 “dataset_readme.md” 必选文件，数据集要求说明，定义了模型训练时对数据集的要求，会显示在微调工作流的“准备数据”页面。 “requirements.txt” 非必选文件，环境配置文件，定义了项目依赖的python包。AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型

总条数： 1259

上一页
1
...
29
30
31
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

自动学习模型训练图片异常？ - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

在线服务预测报错DL.0105 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

Huggingface缓存目录空间不足，出现OSError: [Errno 122] Disk quota exceeded - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

Lite Cluster高危操作一览表 - AI开发平台ModelArts

开发环境提示空间不足，如何解决？ - AI开发平台ModelArts

什么是自动学习？ - AI开发平台ModelArts

开发环境提示空间不足，如何解决？ - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

NPU_Flash_Attn融合算子约束 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

日志提示Compile graph failed - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线