搜索_华为云

准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像准备大模型推理适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。镜像版本本教程中用到基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
配置Lite Server存储 - AI开发平台ModelArts

弹性文件服务SFS 对象存储服务OBS 云硬盘EVS 概念提供按需扩展的高性能文件存储，可为云上多个云服务器提供共享访问。弹性文件服务就类似Windows或Linux中的远程目录。提供海量、安全、高可靠、低成本的数据存储能力，可供用户存储任意类型和大小的数据。可以为云服务器提供高可靠

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
安装Gallery CLI配置工具 - AI开发平台ModelArts

CLI配置工具当Gallery CLI配置工具包下载完成后，进入服务器安装工具。不管是ModelArts Lite云服务，还是本地Windows/Linux等服务器，安装操作都相同。登录服务器，激活python虚拟环境。 conda activate [env_name] #

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

u+华为自研Ascend Snt9b硬件，为用户提供了开箱即用的预训练和全量微调方案。同时利用昇腾高性能算子库Ascend Transformer Boost（ATB）和适配昇腾平台的大模型推理服务Text Generation Inference（TGI） + 华为自研Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
SD1.5基于Lite Server适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

5模型基础上，使用新的数据集进行微调（fine-tuning）以优化模型性能的过程。本文档主要介绍如何利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，对Stable Diffusion模型下不同数据集进行高性能训练调优，同时启用多卡作业方式提升训练速度，完成SD1

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
安全 - AI开发平台ModelArts
安全 - AI开发平台ModelArts

安全责任共担资产识别与管理身份认证与访问控制数据保护技术审计与日志服务韧性监控安全风险故障恢复更新管理认证证书安全边界

 帮助中心 > AI开发平台ModelArts > 产品介绍
在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

索、多模态搜索增强。盘古数字人大脑：基于在MaaS开源大模型部署的模型API，升级智能对话解决方案，含智能客服、数字人。 Dify：支持自部署的应用构建开源解决方案，用于Agent编排、自定义工作流。操作步骤登录ModelArts Studio控制台，在顶部导航栏选择目标区域。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

使用ModelArts提供的模型运行指导，其余场景再考虑使用本指导自行迁移和调优。迁移流程模型迁移主要指将开源社区中实现过的模型或客户自研模型迁移到昇腾AI处理器上，需要保证模型已经在CPU/GPU上运行成功。迁移到昇腾AI处理器的主要流程如下图所示。图1 迁移流程父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

提供节点级、作业级、容器级，多级故障恢复，保障千卡作业稳定训练。多种资源形态集群模式，开箱即提供好Kubernetes集群，直接使用，方便高效。节点模式，客户可采用开源或自研框架，自行构建集群，更强的掌控力和灵活性。零改造迁移提供业界通用的k8s接口使用资源，业务跨云迁移无压力。 SSH直达节点和容器，一致体验。

帮助中心 > AI开发平台ModelArts > 产品介绍
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

（可选）预处理器的配置文件。 modeling_xxx.py （可选）自定义模型的代码文件，继承自PretrainedModel，包含实现自定义推理逻辑的代码。 configuration_xxx.py （可选）自定义配置的代码文件，继承自PretrainedConfig，包含实现自定义配置的逻辑代码。父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
ModelArts SDK、OBS SDK和MoXing的区别是什么？ - AI开发平台ModelArts

SDK前，需下载OBS SDK包，然后在本地开发环境中安装使用。详细指导：《OBS SDK参考》 MoXing MoXing是ModelArts自研的组件，是一种轻型的分布式框架，构建于TensorFlow、PyTorch、MXNet、MindSpore等深度学习引擎之上，使得这些计算

 帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
什么是ModelArts - AI开发平台ModelArts

底层的技术。同时，ModelArts支持Tensorflow、PyTorch、MindSpore等主流开源的AI开发框架，也支持开发者使用自研的算法框架，匹配您的使用习惯。产品形态 ModelArts提供多种产品形态，如下表所示。表1 ModelArts产品形态介绍产品形态

 帮助中心 > AI开发平台ModelArts > 产品介绍
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

的资源。自定义指标数据格式自定义指标数据的格式必须是符合open metrics规范的文本，即每个指标的格式应为： <指标名称>{<标签名称>=<标签值>,...} <采样值> [毫秒时戳] 举例如下（#开头为注释，非必需）： # HELP http_requests_total

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
Lite Server资源开通 - AI开发平台ModelArts

指使用设置初始密码方式作为裸金属服务器的鉴权方式，此时，您可以通过用户名密码方式登录裸金属服务器。 Linux操作系统时为root用户的初始密码，Windows操作系统时为Administrator用户的初始密码。密码复杂度需满足以下要求：长度为8至26个。至少包含大写字母、小写字母、数字及特殊符号(

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
管理训练容器环境变量 - AI开发平台ModelArts

管理训练容器环境变量什么是环境变量本章节展示了训练容器环境中预置的环境变量，方便用户查看，主要包括以下类型。路径相关环境变量分布式训练作业环境变量 NCCL（Nvidia Collective multi-GPU Communication Library）环境变量 OBS环境变量

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

如果在linux服务器上运行就有问题，那么先调通以后再做容器镜像。确认打入镜像的文件是否在正确的位置、是否有正确的权限。训练场景主要查看自研的依赖包是否正常，查看pip list是否包含所需的包，查看容器直接调用的python是否是自己所需要的那个（如果容器镜像装了多个pyth

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

参数的模型，即：Llama2-7B、Llama2-13B、Llama2-70B。方案概览本文档利用训练框架Pytorch_npu+华为自研Ascend Snt9b硬件，为用户提供了开箱即用的预训练和全量微调方案。本文档以Llama2-70B为例，同时适用于Llama2-7B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904）
Lite Cluster&Server介绍 - AI开发平台ModelArts

ite Server。 ModelArts Lite Cluster面向k8s资源型用户，提供托管式k8s集群，并预装主流AI开发插件以及自研的加速插件，以云原生方式直接向用户提供AI Native的资源、任务等能力，用户可以直接操作资源池中的节点和k8s集群。请参见弹性集群k8s

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

步骤5：清除相应资源准备工作本地已安装2019.2-2023.2之间（包含2019.2和2023.2）版本的PyCharm专业版工具，推荐Windows版本，社区版或专业版均可，请单击PyCharm工具下载地址获取工具并在本地完成安装。使用PyCharm ToolKit远程连接Not

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
训练的数据集预处理说明 - AI开发平台ModelArts

类的实现。 GeneralPretrainHandler解析 GeneralPretrainHandler是处理预训练数据集的一个类，继承自BaseDatasetHandler，实现对alpaca格式预训练数据集的处理。 def _filter(self, sample):

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明

总条数： 285

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备镜像 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

SD1.5基于Lite Server适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

安全 - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

ModelArts SDK、OBS SDK和MoXing的区别是什么？ - AI开发平台ModelArts

什么是ModelArts - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Lite Cluster&Server介绍 - AI开发平台ModelArts

使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线