搜索_华为云

查看Standard专属资源池详情 - AI开发平台ModelArts

签操作。图3 单个节点操作在节点的搜索栏，支持通过节点的名称、节点状态、高可用冗余、批次、驱动版本、驱动状态、IP地址、资源标签等关键字搜索节点。支持导出Standard资源池的节点信息到Excel表格中，方便查阅。勾选节点名称，在节点列表上方单击“导出 > 导出全部数据到XLSX”或者“导出

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
管理Lite Cluster节点 - AI开发平台ModelArts

Cluster资源池单个节点驱动章节。查找搜索节点在节点管理页面的搜索栏中，支持通过节点名称、状态、批次、驱动版本、驱动状态、IP地址、节点池、资源标签等关键字搜索节点。设置节点列表显示信息在节点管理页面中，单击右上角的设置图标，支持对节点列表中显示的信息进行自定义。父主题： Lite Cluster资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
预训练任务 - AI开发平台ModelArts

etrain_13b.sh localhost 1 0 等待模型载入执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入更多查看训练日志和性能操作，请参考查看日志和性能章节。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
创建Notebook实例 - AI开发平台ModelArts

请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 实例描述信息，长度限制为512字符，且不能包含字符&<>"'/。 duration 否 Long 以当前时刻为起点，运行的时长（到期后自动停止），推荐该属性在leaseRe

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
预训练任务 - AI开发平台ModelArts

etrain_13b.sh localhost 1 0 等待模型载入执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入训练完成后，生成的权重文件保存路径为：/home/m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Cluster资源池节点故障如何定位故障说明和处理建议图1 Lite池故障处理流程对于ModelArts Lite资源池，每个节点会以DaemonSet方式部署node-agent组件，该组件会检测节点状态，并将检测结果写到K8S NodeCondtition中。同时，节点

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

使用ModelArts VSCode插件调试训练ResNet50图像分类模型应用场景 Notebook等线上开发工具工程化开发体验不如IDE，但是本地开发服务器等资源有限，运行和调试环境大多使用团队公共搭建的CPU或GPU服务器，并且是多人共用，这带来一定的环境搭建和维护成本。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
在MaaS中创建模型 - AI开发平台ModelArts

自定义模型名称。支持1~64位，以中文、大小写字母开头，只包含中文、大小写字母、数字、下划线（_）、中划线（-）和（.）。描述模型简介。支持100字符。权重设置与词表默认选择“自定义权重”。使用用户自定义的权重文件，需要先将权重文件上传至OBS桶中。且权重文件必须满足对应模型的文件格式要求，详情请参见约束限制。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

构造请求本节介绍REST API请求的组成，并以调用IAM服务的获取用户Token接口说明如何调用API，Token可以用于调用其他API时的鉴权。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
更新Notebook实例 - AI开发平台ModelArts

请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 支持更新实例描述信息，长度限制为512字符，不可包含特殊字符&<>"'/。 endpoints 否 Array of EndpointsReq objects 本地IDE（如PyCharm、VS

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练什么是Eagle投机小模型训练 2013年12月滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布Eagle，旨在提升大语言模型的推理速度，同时保证模型输出文本的分布一致。这种方法外推LLM的第二顶层特征向量，能够显著提升生成效率。 Eagle训练了一个单层模型，使用input

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 ModelArts集成了多个昇腾迁移调优工具，方便您在ModelArts平台环境中进行训练推理迁移、精度调试、性能调优等工作，您可在下表中查看当前ModelArts支持的昇腾迁移调优工具及对应指导。表格中的部分工具已集成到ModelArt

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
执行训练任务 - AI开发平台ModelArts

其中ASCEND_RT_VISIBLE_DEVICES=0,1,2,3指使用0-3卡执行训练任务。训练成功标志 “***** train metrics *****”关键字打印训练完成后，请参考查看日志和性能章节查看指令微调的日志和性能。 1、如训练过程中遇到“NPU out of memory”“Permission

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
部署在线服务 - AI开发平台ModelArts

部署在线服务部署在线服务包括：已部署为在线服务的初始化。部署在线服务predictor。部署批量服务transformer。部署服务返回服务对象Predictor，其属性包括服务管理章节下的所有功能。示例代码在ModelArts notebook平台，Session

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
创建并管理工作空间 - AI开发平台ModelArts

必填，工作空间的名称。支持4~64位可见字符，名称可以包含字母、中文、数字、中划线（-）或下划线（_）。描述工作空间的简介。支持0~256位字符。企业项目必填，选择绑定的企业项目。当没有合适的企业项目时，可以单击“新建企业项目”跳转到企业项目管理页面，创建新的企业项目再绑定。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
预训练任务 - AI开发平台ModelArts

scripts/llama2/0_pl_pretrain_13b.sh 等待模型载入执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入最后，请参考查看日志和性能章节查看预训练的日志和性能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907）
Lite Cluster资源开通 - AI开发平台ModelArts

Lite Cluster资源开通集群资源开通流程开通集群资源过程中用户侧需要完成的任务流程如下图所示。图1 用户侧任务流程表1 Cluster资源开通流程任务说明 Step1 申请开通资源规格当前部分规格为受限购买，需要提前联系客户经理申请开通资源规格，预计1~3个

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
创建AI应用 - AI开发平台ModelArts

创建AI应用功能介绍导入元模型创建AI应用。执行代码、模型需先上传至OBS（训练作业生成的模型已默认存储到OBS）。接口约束使用模板导入模型与不使用模板导入这两类导入方式的Body参数要求不一样。以下Body参数说明中以模板参数表示适合使用模板导入模型时填写的参数，非模

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
LoRA微调训练 - AI开发平台ModelArts

kubectl logs -f ${pod_name} 等待模型载入执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入训练完成后，生成的权重文件保存路径为：/mnt/sf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）
SFT全参微调训练任务 - AI开发平台ModelArts

kubectl logs -f ${pod_name} 等待模型载入执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入训练完成后，生成的权重文件保存路径为：/mnt/sf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）

总条数： 285

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看Standard专属资源池详情 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线