搜索_华为云

模型推理代码编写说明 - AI开发平台ModelArts

model_name, model_path) 初始化方法，适用于深度学习框架模型。该方法内加载模型及标签等（pytorch和caffe类型模型必须重写，实现模型加载逻辑）。 __init__(self, model_path) 初始化方法，适用于机器学习框架模型。该方法内初始化模型的路径（self

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
yaml配置文件参数配置说明 - AI开发平台ModelArts

可选项。用于指定DeepSpeed的配置文件相对或绝对路径。DeepSpeed是一个开源库，用于加速深度学习训练。通过使用DeepSpeed，可以实现如混合精度训练、ZeRO内存优化等高级特性，以提高训练效率和性能 stage sft 表示训练类型。可选择值：[pt、sf、rm、ppo]

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

参数说明 “元模型来源” 选择“从训练中选择”。在“选择训练作业”右侧下拉框中选择当前账号下已完成运行的训练作业。 “动态加载”：用于实现快速部署和快速更新模型。如果勾选动态加载，则模型文件和运行时依赖仅在实际部署时拉取。当单个模型文件大小超过5GB时，必须配置“动态加载”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

##认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 ##本示例以AK和SK保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。 #

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

ndSpore-Lite迁移路线进行介绍。使用ascend-vllm路线的迁移指导会在后续提供，您可以从上面的案例中下载相关代码并直接参考实现源码。父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
LLM大语言模型训练推理 - AI开发平台ModelArts

LLM大语言模型训练推理在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）主流开源大模型基于Lite Server适配ModelLink

帮助中心 > AI开发平台ModelArts > 最佳实践
基于MaaS DeepSeek API和Chatbox快速构建文案编辑器 - AI开发平台ModelArts

服务能力，满足业务商用部署需求，支持广大开发者在线体验或端外调用。同时，MaaS提供免费Token支持开发者免费使用，帮助开发者快速验证和实现创新应用。更多信息，请参见免费体验MaaS预置服务。步骤一：下载并安装Chatbox 您可以通过官方网站或Github下载并安装Chatbox。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理
执行训练任务（历史版本） - AI开发平台ModelArts

业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图3 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

torchair_cache文件夹，避免由于缓存文件与实际推理不匹配而报错。若要使用eagle投机，配置环境变量，使eagle投机对齐实验室版本实现。目前默认开启此模式，若不开启，目前vllm0.6.0版本与实验室版本权重无法对齐，会导致小模型精度问题。 export EAGLE_US

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
Standard资源池功能介绍 - AI开发平台ModelArts

移Standard专属资源池和网络至其他工作空间将资源池移动到对应的工作空间下。专属资源池可通过标签来进行管理，具体可参见使用TMS标签实现资源分组管理管理专属资源池标签。当不再需要使用专属资源池时，您可参考释放Standard专属资源池和删除网络删除专属资源池。父主题： ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

4台8卡Vnt1），存储方案推荐使用“SFS（存放数据）+普通OBS桶（存放代码）”，采用分布式训练。当使用SFS+OBS的存储方案可以实现存储加速，该方案的端到端实践案例请参见面向AI场景使用OBS+SFS Turbo的存储加速实践。表1 不同场景所需服务及购买推荐场景 OBS

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
执行训练任务【新】 - AI开发平台ModelArts

业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图4 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
Lite Cluster资源配置流程 - AI开发平台ModelArts

动不满足业务要求，可通过本章节将驱动升级到指定版本。 5 （可选）配置镜像预热 Lite Cluster资源池支持镜像预热功能，镜像预热可实现将镜像提前在资源池节点上拉取好，在推理及大规模分布式训练时有效缩短镜像拉取时间。快速配置Lite Cluster资源案例下文提供一个快

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
管理Lite Cluster资源池 - AI开发平台ModelArts

池详情页面。在资源池详情页面，单击“标签”页签查看标签信息。支持添加、修改、删除标签。标签详细用法请参见ModelArts如何通过标签实现资源分组管理。图3 标签最多支持添加20个标签。 Lite Cluster资源池配置管理在资源池详情页面，单击“配置管理”，在配置管

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

torchair_cache文件夹，避免由于缓存文件与实际推理不匹配而报错。如果要使用eagle投机，配置环境变量，使eagle投机对齐实验室版本实现。目前默认开启此模式，如果不开启，目前vllm0.6.3版本与实验室版本权重无法对齐，会导致小模型精度问题。 export EAGLE_U

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
执行训练任务（推荐） - AI开发平台ModelArts

业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图3 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
部署推理服务 - AI开发平台ModelArts

增加该参数，如果未使用量化功能，则无需配置。根据使用的量化方式配置，可选择awq或smoothquant方式。该参数可与投机推理配合使用，实现投机校验模型的量化功能。 --speculative-model ${container_draft_model_path}：投机草稿模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
部署推理服务 - AI开发平台ModelArts

增加该参数，如果未使用量化功能，则无需配置。根据使用的量化方式配置，可选择awq或smoothquant方式。该参数可与投机推理配合使用，实现投机校验模型的量化功能。 --speculative-model ${container_draft_model_path}：投机草稿模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
Lite Cluster使用流程 - AI开发平台ModelArts

Cluster的基本使用流程，帮助您快速上手。图1 资源池架构图如图所示为Lite Cluster架构图。Lite Cluster基于CCE服务实现对资源节点的管理，因此，用户首先需要购买一个CCE集群。在ModelArts控制台购买Lite Cluster集群时，ModelArts的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
Yaml配置文件参数配置说明 - AI开发平台ModelArts

可选项。用于指定DeepSpeed的配置文件相对或绝对路径。DeepSpeed是一个开源库，用于加速深度学习训练。通过使用DeepSpeed，可以实现如混合精度训练、ZeRO内存优化等高级特性，以提高训练效率和性能 stage sft 表示当前的训练阶段。可选择值：[pt、sft、rm、

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明

总条数： 504

上一页
1
...
20
21
22
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型推理代码编写说明 - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

LLM大语言模型训练推理 - AI开发平台ModelArts

基于MaaS DeepSeek API和Chatbox快速构建文案编辑器 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

管理Lite Cluster资源池 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线