搜索_华为云

性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

绝大多数情况下，昇腾芯片推理性能相比于CPU会好很多，但是也可能会遇到和CPU推理性能并无太大差别甚至出现劣化的情况。造成这种情况的原因可能有如下几种：模型中存在大量的类似于Pad或者Strided_Slice等算子，其在CPU和Ascend上的实现方法存在差异（硬件结构不同），后者在运算此类算子时涉及到数组的重排，性能较差；

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用Nvidia-smi工具 - 云容器实例 CCI

使用Nvidia-smi工具为了支持查看GPU使用情况的场景，需要在镜像中注入nvidia-smi工具，根据购买的专属节点GPU驱动版本选择不同的nvidia-smi二进制文件。 nvidia-smi获取方式。该二进制文件可以在nvidia官网，根据CUDA Toolkit版

 帮助中心 > 云容器实例 CCI > 最佳实践 > GPU负载
GPU虚拟化 - 云容器引擎 CCE
GPU虚拟化 - 云容器引擎 CCE

GPU虚拟化 GPU虚拟化概述准备GPU虚拟化资源使用GPU虚拟化兼容Kubernetes默认GPU调度模式父主题： GPU调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
GPU视图 - 云容器引擎 CCE
GPU视图 - 云容器引擎 CCE

GPU视图 GPU资源指标可以衡量GPU性能和使用情况，包括GPU的利用率、温度、显存等方面的监控数据，帮助您掌控GPU运行状况。指标说明图1 GPU资源指标表1 GPU图表说明图表名称单位说明集群-显存使用率百分比集群的显存使用率计算公式：集群内容器显存使用总量/集群内显存总量

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
G系列弹性云服务器GPU驱动故障 - 弹性云服务器 ECS

G系列弹性云服务器GPU驱动故障问题描述在Windows系统的G系列弹性云服务器中，无法打开NVIDIA 控制面板，GPU驱动无法使用或GPU驱动显示异常。可能原因 GPU驱动状态异常。处理方法打开Windows设备管理器，在显示适配器中查看GPU驱动状态。 GPU驱动显示正常

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU驱动故障
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

[acl_init_options] ge.op_compiler_cache_mode="force" 迁移后应用出图效果相比GPU无法对齐怎么办？扩散模型在噪音和随机数上的生成，本身就有一定的随机性，GPU和NPU（Ascend）硬件由于存在一定细小的差别，很难确保完全一致，较难达成生成图片100%匹配，建议通过盲测的方式对效果进行验证。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
GPU计算型 - CloudPond云服务
GPU计算型 - CloudPond云服务

GPU计算型 GPU计算单元包含的计算资源主要适用于政企用户部署GPU密集型业务到CloudPond上使用的场景，对应华为云ECS的实例包含Pi系列，用户可根据机型规格情况选择对应的计算资源商品。具体规格请参考表1。表1 GPU计算单元名称算力配置描述 GPU计算单元-汇聚型-2Pi2

帮助中心 > CloudPond云服务 > 产品介绍 > 产品规格 > 计算资源规格
GPU设备检查 - 智能边缘平台 IEF

GPU设备检查功能检查节点是否存在gpu设备，gpu驱动是否安装且运行正常。语法 edgectl check gpu 参数说明无使用示例检查节点GPU设备： edgectl check gpu 检查成功返回结果： +-----------------------+ |

帮助中心 > 智能边缘平台 IEF > Edgectl使用指南 > edgectl 命令详情 > 单独项检查
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

当前推理业务的操作系统及版本，如：Ubuntu 22.04。是否使用容器化运行业务，以及容器中OS版本，HostOS中是否有业务软件以及HostOS的类型和版本。需要评估是否愿意迁移到华为云的通用OS。 - AI引擎及版本当前引擎（TF/PT/LibTorch），是否接受切换MindSpore。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
如何避免非GPU/NPU负载调度到GPU/NPU节点？ - 云容器引擎 CCE

如何避免非GPU/NPU负载调度到GPU/NPU节点？问题现象当集群中存在GPU/NPU节点和普通节点混合使用的场景时，普通工作负载也可以调度到GPU/NPU节点上，可能出现GPU/NPU资源未充分利用的情况。问题原因由于GPU/NPU节点同样提供CPU、内存资源，在一般

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
GPU节点驱动版本 - 云容器引擎 CCE

GPU节点驱动版本选择GPU节点驱动版本 CCE推荐的GPU驱动版本列表手动更新GPU节点驱动版本通过节点池升级节点的GPU驱动版本父主题： GPU调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
GPU推理业务迁移至昇腾的通用指导 - AI开发平台ModelArts

GPU推理业务迁移至昇腾的通用指导简介昇腾迁移快速入门案例迁移评估环境准备模型适配精度校验性能调优迁移过程使用工具概览常见问题推理业务迁移评估表父主题： GPU业务迁移至昇腾训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
服务版本差异 - Web应用防火墙 WAF

扩展包和规则扩展包，以满足更多域名、更大流量的防护需求，也可以通过变更WAF云模式版本和规格从较低版本升级到任一更高版本。服务版本从低到高依次为：“入门版”、“标准版”、“专业版”、“铂金版”。表2 适用的业务规格业务规格云模式独享模式（按需计费）入门版标准版专业版

 帮助中心 > Web应用防火墙 WAF > 产品介绍
应用GPU资源调度方式 - 智能边缘平台 IEF

应用GPU资源调度方式 IEF支持多应用共享的方式使用GPU显卡。 IEF支持单个应用使用多个GPU显卡。 GPU资源调度基于GPU显存容量，调度采用GPU显存预分配方式而非实时GPU显存资源。当应用需要使用的GPU显存资源小于单个GPU卡显存时，支持以共享方式进行资源调度，对

 帮助中心 > 智能边缘平台 IEF > 常见问题 > 边缘应用
操作系统监控GPU页面显示无记录该如何处理？ - 云监控服务 CES

操作系统监控GPU页面显示无记录该如何处理？在查看主机监控的监控指标时，如果出现操作系统监控GPU页面显示无记录的问题，请先确认您的机器是否支持GPU。若您的机器支持GPU且驱动运行正常，请参考以下操作步骤升级插件为增强版：卸载当前基础版Agent： Linux平台：登录机器执行命令

 帮助中心 > 云监控服务 CES > 常见问题 > 主机监控
推理业务迁移评估表 - AI开发平台ModelArts

当前推理业务的操作系统及版本，如：Ubuntu 22.04。是否使用容器化运行业务，以及容器中OS版本，HostOS中是否有业务软件以及HostOS的类型和版本。需要评估是否愿意迁移到华为云的通用OS。 - AI引擎及版本当前引擎（TF/PT/LibTorch），是否接受切换MindSpore。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Lite生成的图像和onnx模型的输出结果有明显的差异，因此需要对MindSpore Lite pipeline进行精度诊断。图1 结果对比在MindSpore Lite 2.0.0版本中，Stable Diffusion的五个模型的精度都能够保证一致性，但是在最新的2.1.0版本中，会

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
GPU训练业务迁移至昇腾的通用指导 - AI开发平台ModelArts

GPU训练业务迁移至昇腾的通用指导训练业务迁移到昇腾设备场景介绍训练迁移快速入门案例 PyTorch迁移精度调优 PyTorch迁移性能调优训练网络迁移总结父主题： GPU业务迁移至昇腾训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

模型适配基于MindSpore Lite的模型转换动态shape 父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
GPU驱动故障 - 弹性云服务器 ECS

GPU驱动故障 G系列弹性云服务器GPU驱动故障 GPU驱动异常怎么办？ GPU驱动不可用 GPU设备显示异常 T4 GPU设备显示异常 GPU实例启动异常，查看系统日志发现NVIDIA驱动空指针访问怎么办？

帮助中心 > 弹性云服务器 ECS > 故障排除

总条数： 9740

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

性能调优 - AI开发平台ModelArts

使用Nvidia-smi工具 - 云容器实例 CCI

GPU虚拟化 - 云容器引擎 CCE

GPU视图 - 云容器引擎 CCE

G系列弹性云服务器GPU驱动故障 - 弹性云服务器 ECS

常见问题 - AI开发平台ModelArts

GPU计算型 - CloudPond云服务

GPU设备检查 - 智能边缘平台 IEF

迁移评估 - AI开发平台ModelArts

如何避免非GPU/NPU负载调度到GPU/NPU节点？ - 云容器引擎 CCE

GPU节点驱动版本 - 云容器引擎 CCE

GPU推理业务迁移至昇腾的通用指导 - AI开发平台ModelArts

服务版本差异 - Web应用防火墙 WAF

应用GPU资源调度方式 - 智能边缘平台 IEF

操作系统监控GPU页面显示无记录该如何处理？ - 云监控服务 CES

推理业务迁移评估表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

GPU训练业务迁移至昇腾的通用指导 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

GPU驱动故障 - 弹性云服务器 ECS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线