搜索_华为云

SFT微调权重转换 - AI开发平台ModelArts

SFT微调权重转换微调训练前需将HuggingFace格式权重转换为Megatron格式后再进行SFT微调训练。本章节主要介绍如何将HuggingFace权重转换为Megatron格式。此处的HuggingFace权重文件和转换操作结果同时适用于SFT微调和LoRA微调训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT微调训练
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

预训练前提条件已上传训练代码、训练权重文件和数据集到SFS Turbo中，具体参考代码上传至OBS和使用Notebook将OBS数据导入SFS Turbo。 Step1 在Notebook中修改训练超参配置以llama2-13b预训练为例，执行脚本0_pl_pretrain_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
查询开发环境实例列表 - AI开发平台ModelArts

查询开发环境实例列表功能介绍该接口用于查询开发环境实例列表，用户可按需查询满足条件的开发环境实例列表。 URI GET /v1/{project_id}/demanager/instances?de_type={de_type}&provision_type={provision_type

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式，使用W8A16的量化不仅可以保证精度在可接受的范围内，同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见支持的模型列表和权重文件。本章节介绍如何在GPU的机器上使用开源GPTQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式，使用W8A16的量化不仅可以保证精度在可接受的范围内，同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见表3。本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导场景描述本文将介绍在GP Ant8裸金属服务器中，使用Megatron-Deepspeed框架训练GPT-2（分别进行单机单卡和单机多卡训练）。训练完成后给出自动式生成内容，和交互式对话框模式。背景信息 Megatron-Deepspeed

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
导入模型 - AI开发平台ModelArts
导入模型 - AI开发平台ModelArts

导入模型导入模型功能包括：初始化已存在的模型，根据模型ID生成模型对象。创建模型。模型对象的属性，请参见查询模型详情。示例模型文件以PyTorch为例，编写模型文件。PyTorch模型包结构可参考模型包规范介绍。 OBS桶/目录名 ├── resnet │ ├── model

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
查询开发环境实例详情 - AI开发平台ModelArts

查询开发环境实例详情功能介绍该接口用于查询开发环境实例详情。 URI GET /v1/{project_id}/demanager/instances/{instance_id} 参数说明如表1所示表1 参数说明参数是否必选参数类型说明 project_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
更新Workflow Execution - AI开发平台ModelArts

更新Workflow Execution 功能介绍通过ID更新Workflow Exectuion。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI PUT

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
SFT全参微调训练 - AI开发平台ModelArts

SFT全参微调训练前提条件已上传训练代码、训练权重文件和数据集到SFS Turbo中，具体参考代码上传至OBS和使用Notebook将OBS数据导入SFS Turbo。 Step1 在Notebook中修改训练超参配置以llama2-13b SFT微调为例，执行脚本 0_pl_sft

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
更新网络资源 - AI开发平台ModelArts

更新网络资源功能介绍更新指定网络资源。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI PATCH /v1/{project_id}/networks/{network_name

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
SFT全参微调训练 - AI开发平台ModelArts

SFT全参微调训练前提条件已上传训练代码、训练权重文件和数据集到SFS Turbo中。 Step1 在Notebook中修改训练超参配置以llama2-13b SFT微调为例，执行脚本 0_pl_sft_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练前提条件已上传训练代码、训练权重文件和数据集到SFS Turbo中。 Step1 在Notebook中修改训练超参配置以llama2-13b LORA微调为例，执行脚本0_pl_lora_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
AI应用管理 - AI开发平台ModelArts

AI应用管理创建AI应用失败，如何定位和处理问题？导入AI应用提示该账号受限或者没有操作权限用户创建AI应用时构建镜像或导入文件失败创建AI应用时，OBS文件目录对应镜像里面的目录结构是什么样的？通过OBS导入AI应用时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
ModelArts预置镜像更新说明 - AI开发平台ModelArts

ModelArts预置镜像更新说明本章节提供了ModelArts预置镜像的变更说明，比如依赖包的变化，方便用户感知镜像能力的差异，减少镜像使用问题。镜像中包含的依赖项的查询方法：在Terminal里执行如下命令。 pip list 统一镜像更新说明表1 统一镜像更新说明镜像名称

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
推理专属预置镜像列表 - AI开发平台ModelArts

推理专属预置镜像列表 ModelArts的推理平台提供了一系列的基础镜像，用户可以基于这些基础镜像构建自定义镜像，用于部署推理服务。 X86架构（CPU/GPU）的推理基础镜像表1 TensorFlow AI引擎版本支持的运行环境镜像名称 URI 2.1.0 CPU GPU(

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
创建训练作业 - AI开发平台ModelArts

创建训练作业示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。 ModelArts SDK不支持通过在AI Gallery中订阅的算法创建训练作业。示例一：提交常用框架训练作业 Estimator

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

服务韧性韧性特指安全韧性，即云服务受攻击后的韧性，不含可靠性、可用性。本章主要阐述ModelArts服务受入侵的检测响应能力、防抖动的能力、域名合理使用、内容安全检测等能力。安全防护套件覆盖和使用堡垒机，增强入侵检测和防御能力 ModelArts服务部署主机层、应用层、网络层和数据层的安全防护套件

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel,

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 推理模型量化

总条数： 818

上一页
1
...
28
29
30
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SFT微调权重转换 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

导入模型 - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

更新Workflow Execution - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

更新网络资源 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

AI应用管理 - AI开发平台ModelArts

ModelArts预置镜像更新说明 - AI开发平台ModelArts

推理专属预置镜像列表 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线