搜索_华为云

使用AWQ量化工具转换权重 - AI开发平台ModelArts

com/casper-hansen/AutoAWQ.git AutoAWQ-0.2.5 cd ./AutoAWQ-0.2.5 export PYPI_BUILD=1 pip install -e . 需要编辑“examples/quantize.py”文件，针对NPU进行如下适配工作，以支持在NPU上进行量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
执行训练任务 - AI开发平台ModelArts

5、训练过程中报"ModuleNotFoundError: No module named 'multipart'"关键字异常，可更新python-multipart为0.0.12版本，具体请参考6-问题6：No module named 'multipart'"报错：。父主题：主流开源大模型基于DevServer适配LlamaFactory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
训练作业权限 - AI开发平台ModelArts

modelarts:trainJob:delete - √ √ 查询训练作业详情 GET /v2/{project_id}/training-jobs/{training_job_id} modelarts:trainJob:get - √ √ 查询训练作业列表 POST /v2/{project

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
更新标注团队成员 - AI开发平台ModelArts

标注团队成员ID。 workforce_id 是 String 标注团队ID。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 标注成员描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 role 否 Integer 角色。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
更新标注团队 - AI开发平台ModelArts

workforce_id 是 String 标注团队ID。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 标注团队描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 workforce_name 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用TMS标签实现资源分组管理 - AI开发平台ModelArts

见什么是区域、可用区？。资源类型：ModelArts支持查询的资源类型如表1所示。资源标签：不填写标签时，表示查询所有资源，无论此资源是否有配置标签。选择相应标签查询资源，用户可以通过多个标签组合查询资源使用情况。表1 ModelArts的资源类型资源类型说明 ModelArts-Notebook

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
训练性能测试 - AI开发平台ModelArts

--baseline <baseline> --o <output_dir> <cfgs_yaml_file>：性能测试配置的yaml文件地址，指代码目录中performance_cfgs.yaml相对或绝对路径，此配置文件为训练最优配置参数。 --baseline <basel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
创建标注任务 - AI开发平台ModelArts

dataset.create_label_task(task_name="obj_detection_task", task_type=1, description="label task") 参数说明表1 请求参数参数是否必选参数类型描述 task_name 是 String 标注任务的名称。

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 标注任务管理
W8A16量化 - AI开发平台ModelArts
W8A16量化 - AI开发平台ModelArts

在GPU的机器上使用开源GPTQ量化工具GPTQ (huggingface.co)量化模型权重。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers 设置GPTQC

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
更新处理任务 - AI开发平台ModelArts

请求Body参数参数是否必选参数类型描述 description 否 String 数据处理任务描述，长度为0-256位，不能包含^!<>=&"'特殊字符。响应参数无请求示例更新数据处理任务 { "description" : "test" } 响应示例状态码： 200

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
应用迁移 - AI开发平台ModelArts
应用迁移 - AI开发平台ModelArts

应用迁移模型适配 pipeline代码适配父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
查看批量服务详情 - AI开发平台ModelArts

查看批量服务详情当模型部署为批量服务成功后，您可以进入“批量服务”页面，来查看服务详情。登录ModelArts管理控制台，在左侧菜单栏中选择“模型部署>批量服务”，进入“批量服务”管理页面。单击目标服务名称，进入服务详情页面。您可以查看服务的“名称”、“状态”等信息，详情说明请参见表1。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
创建标注团队的成员 - AI开发平台ModelArts

workforce_id 是 String 标注团队ID。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 成员描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 emails 是 String 团队成员的邮箱。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建标注团队 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 标注团队描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 workforce_name 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用AWQ量化工具转换权重 - AI开发平台ModelArts

activate awq pip uninstall ascend-vllm vllm transformers bash build.sh 2、运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

流水账单”中，“消费时间”即按需产品的实际使用时间。查看自动学习和Workflow的账单自动学习和Workflow运行时，在进行训练作业和部署服务时，会产生不同的账单。训练作业产生的账单可参考查看训练作业的账单查询。部署服务产生的账单可参考查看在线服务的账单查询。查看Notebook的账单登录

 帮助中心 > AI开发平台ModelArts > 计费说明
附录：训练常见问题 - AI开发平台ModelArts

ers版本 GLM4-9B模型，容器内执行以下步骤： pip install transformers==4.43.2 其它模型，容器内执行以下步骤： pip install transformers==4.45.0 pip install tokenizers==0.20.0 使用原始hf权重的tokenizer

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
附录：训练常见问题 - AI开发平台ModelArts

ers版本 GLM4-9B模型，容器内执行以下步骤： pip install transformers==4.43.2 其它模型，容器内执行以下步骤： pip install transformers==4.45.0 pip install tokenizers==0.20.0 使用原始hf权重的tokenizer

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）

总条数： 1800

上一页
1
...
59
60
61
...
90
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化工具转换权重 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

训练作业权限 - AI开发平台ModelArts

更新标注团队成员 - AI开发平台ModelArts

更新标注团队 - AI开发平台ModelArts

使用TMS标签实现资源分组管理 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

创建标注任务 - AI开发平台ModelArts

W8A16量化 - AI开发平台ModelArts

更新处理任务 - AI开发平台ModelArts

应用迁移 - AI开发平台ModelArts

查看批量服务详情 - AI开发平台ModelArts

创建标注团队的成员 - AI开发平台ModelArts

创建标注团队 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线