搜索_华为云

昇腾迁移快速入门案例 - AI开发平台ModelArts

Diffusion模型通过MSLite进行转换后，迁移在昇腾设备上运行。图3 Stable Diffusion模型迁移到Ascend上进行推理父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
安装GPU指标集成插件 - 云监控服务 CES

安装GPU指标集成插件通过在GPU加速型Linux实例上安装GPU监控插件，可以为用户提供系统级、主动式、细颗粒度的GPU监控，包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标，参见GPU指标。本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件：

帮助中心 > 云监控服务 CES > 用户指南 > 云资源监控 > 主机监控 > 云监控插件（Agent）
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

性能调优单模型性能测试工具Mindspore lite benchmark 单模型性能调优AOE 父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
pipeline代码适配 - AI开发平台ModelArts

参数模型说明已给出，根据模型初始化参数设置当前模型使用onnx模型（运行在CPU上）或mindir模型（运行在昇腾设备上），也能够方便进行精度的校验。 # mslite_model_proxy.py import os import mindspore_lite as mslite

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
PyTorch迁移性能调优 - AI开发平台ModelArts

性能调优总体原则和思路 MA-Advisor性能调优建议工具使用指导 MindStudio-Insight性能可视化工具使用指导父主题： GPU训练业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

动态shape 在某些推理场景中，模型输入的shape可能是不固定的，因此需要支持用户指定模型的动态shape，并能够在推理中接收多种shape的输入。在CPU上进行模型转换时无需考虑动态shape问题，因为CPU算子支持动态shape；而在Ascend场景上，算子需要指定具体的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
安装并配置GPU驱动 - 智能边缘平台 IEF

安装并配置GPU驱动背景信息对于使用GPU的边缘节点，在纳管边缘节点前，需要安装并配置GPU驱动。 IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU，支持CUDA Toolkit 8.0至10.0版本对应的驱动。操作步骤安装GPU驱动。下载GPU驱动，推荐驱动链接：

帮助中心 > 智能边缘平台 IEF > 用户指南 > 专业版操作指南 > 节点管理
安装并配置GPU驱动 - 智能边缘平台 IEF

安装并配置GPU驱动背景信息对于使用GPU的边缘节点，在纳管边缘节点前，需要安装并配置GPU驱动。 IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU，支持CUDA Toolkit 8.0至10.0版本对应的驱动。操作步骤安装GPU驱动。下载GPU驱动，推荐驱动链接：

帮助中心 > 智能边缘平台 IEF > 用户指南 > 铂金版操作指南 > 节点管理
在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？场景描述在使用ModelArts进行自定义深度学习训练时，训练数据通常存储在对象存储服务（OBS）中，且训练数据较大时（如200GB以上），每次都需要使用GPU资源池进行训练，且训练效率低。希望提升训练效率，同时减少与对象存储OBS的交互。可通过如下方式进行调整优化。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

main_worker(args.gpu, ngpus_per_node, args) def main_worker(gpu, ngpus_per_node, args): global best_acc1 args.gpu = gpu if args.gpu is not

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

Megatron-DeepSpeed是一个基于PyTorch的深度学习模型训练框架。它结合了两个强大的工具：Megatron-LM和DeepSpeed，可在具有分布式计算能力的系统上进行训练，并且充分利用了多个GPU和深度学习加速器的并行处理能力。可以高效地训练大规模的语言模型。 M

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

NCCL_DEBUG=INFO DEFAULT_ONE_GPU_BATCH_SIZE=32 BATCH_SIZE=$((${MA_NUM_GPUS:-8} * ${VC_WORKER_NUM:-1} * ${DEFAULT_ONE_GPU_BATCH_SIZE})) if [ ${VC_WORKER_HOSTS}

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍不同AI模型训练所需要的数据量和算力不同，在训练时选择合适的存储及训练方案可提升模型训练效率与资源性价比。ModelArts Standard支持单机单卡、单机多卡和多机多卡的训练场景，满足不同AI模型训练的要求。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
GPU插件检查异常处理 - 云容器引擎 CCE

GPU插件检查异常处理检查项内容检查到本次升级涉及GPU插件，可能影响新建GPU节点时GPU驱动的安装。解决方案由于当前GPU插件的驱动配置由您自行配置，需要您验证两者的兼容性。建议您在测试环境验证安装升级目标版本的GPU插件，并配置当前GPU驱动后，测试创建节点是否正常使用。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

在ModelArts Standard运行GPU训练作业的准备工作使用ModelArts Standard的专属资源池训练时，需要完成以下准备工作。购买服务资源表1 购买服务资源服务使用说明参考文档弹性文件服务SFS 弹性文件服务默认为按需计费，即按购买的存储容量和

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）插件介绍 CCE AI套件（NVIDIA GPU）插件是支持在容器中使用GPU显卡的设备管理插件，集群中使用GPU节点时必须安装本插件。字段说明表1 参数描述参数是否必选参数类型描述 basic 是 object 插件基础配置参数。

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
为什么通过使用量(定价量纲)计算出来的应付金额和华为云显示的应付金额存在精度误差？ - 费用中心

华为云显示的应付金额通过使用量和使用量单位计算，使用量单位通常为最小精度，如秒，以确保数据精确。通过使用量(定价量纲)计算应付金额时，使用量和使用量(定价量纲)在转换过程中，可能由于截断处理导致数据偏差，造成通过使用量(定价量纲)计算出来的应付金额和华为云显示的应付金额存在精度误差。父主题：账单

 帮助中心 > 费用中心 > 常见问题 > 账单
gpu-device-plugin - 华为云UCS
gpu-device-plugin - 华为云UCS

gpu-device-plugin 插件简介 gpu-device-plugin插件是支持在容器中使用GPU显卡的设备管理插件，集群中使用GPU节点时必须安装本插件。约束与限制下载的驱动必须是后缀为“.run”的文件。仅支持Nvidia Tesla驱动，不支持GRID驱动。

帮助中心 > 华为云UCS > 用户指南 > UCS集群 > 单集群管理 > 插件管理
使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

使用dcgm-exporter监控GPU指标应用场景集群中包含GPU节点时，需要了解GPU应用使用节点GPU资源的情况，例如GPU利用率、显存使用量、GPU运行的温度、GPU的功率等。在获取GPU监控指标后，用户可根据应用的GPU指标配置弹性伸缩策略，或者根据GPU指标设置告警规则。本文基于开源Prometheus和DCGM

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

install -r requirements.txt && /bin/sh run.sh 资源池：在“专属资源池”页签选择GPU规格的专属资源池。规格：选择所需GPU规格。计算节点个数：选择需要的节点个数。 SFS Turbo：增加挂载配置，选择SFS名称，云上挂载路径为“/home/ma-user/work”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业

总条数： 6233

上一页
1
...
8
9
10
...
312
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

昇腾迁移快速入门案例 - AI开发平台ModelArts

安装GPU指标集成插件 - 云监控服务 CES

性能调优 - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

PyTorch迁移性能调优 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

安装并配置GPU驱动 - 智能边缘平台 IEF

安装并配置GPU驱动 - 智能边缘平台 IEF

在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

GPU插件检查异常处理 - 云容器引擎 CCE

在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

为什么通过使用量(定价量纲)计算出来的应付金额和华为云显示的应付金额存在精度误差？ - 费用中心

gpu-device-plugin - 华为云UCS

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线