云服务器内容精选

  • 注意事项、 OS诊断目标实例UniAgent状态需要为运行中,UniAgent相关操作请参考配置UniAgent。 OS诊断插件仅支持部分操作系统,详情请见下表: 表1 OS诊断插件支持的操作系统 机器架构 操作系统(OS)类型 OS诊断插件(holmes-agent)是否支持 (Y:支持;N:不支持) X86 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 标准版 64位(40GB) Y CentOS CentOS7.9 Y CentOS 8.0 Y CentOS 8.2 64bit Y CentOS7.8 Y CentOS7.7 Y CentOS7.6 Y CentOS7.5 Y CentOS7.4 Y CentOS7.3 Y CentOS7.2 Y CentOS6.10 N Ubuntu Ubuntu 20.04 server 64bit Y Ubuntu 22.04 server 64bit Y Ubuntu 18.04 server 64bit Y Ubuntu 16.04 server 64bit Y EulerOS EulerOS 2.5 64bit Y Debian Debian 9.0.0 64bit Y Debian 8.8.0 64bit Y Debian 8.2.0 64bit Y Debian 12.0.0 64bit N Debian 11.1.0 64bit Y Debian 10.0.0 64bit Y OpenSUSE OpenSUSE 15.0 64bit Y AlmaLinux AlmaLinux 9.0 64bit N AlmaLinux 8.4 64bit N AlmaLinux 8.3 64bit N Rocky Linux Rocky Linux 9.0 64bit N Rocky Linux 8.5 64bit N Rocky Linux 8.4 64bit N CentOS Stream CentOS Stream 9 64bit Y CentOS Stream 8 64bit Y CoreOS CoreOS 2079.4.0 64bit N openEuler openEuler 22.03 64bit Y openEuler 20.03 64bit Y Others FreeBSD 11.0-RELEASE 64bit N ARM Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 标准版 64位(40GB) Y Ubuntu Ubuntu 18.04 server 64bit Y CentOS CentOS 7.6 64bit with ARM N EulerOS EulerOS 2.8 64bit with ARM N Debian Debian 10.2.0 64bit with ARM N KylinOS Kylin Linux Advanced Server for Kunpeng V10 N openEuler openEuler 20.03 64bit with ARM N
  • 自动诊断工具MA-Advisor简介 MA-Advisor是一款昇腾迁移性能问题自动诊断工具,当前支持如下场景的自动诊断: 推理场景下的子图数据调优分析,给出对应融合算子的调优建议。 推理、训练场景下对Profiling timeline单卡数据进行调优分析,给出相关亲和API替换的调优建议。 推理、训练场景下对Profiling单卡数据进行调优分析,给出AICPU相关调优建议。 推理、训练场景下对Profiling单卡数据进行调优分析,给出block dim、operator no bound相关AOE配置以及调优建议。 支持对昇腾训练、推理环境进行预检,完成相关依赖配置项的提前检查,并在检测出问题时给出相关修复建议。 自动诊断工具可以有效减少人工分析profiling的耗时,降低性能调优的门槛,帮助客户快速识别性能瓶颈点并完成性能优化。推荐用户在采集profiling分析后使用自动诊断工具进行初步性能调优。更进一步的性能调优再使用Ascend-Insight工具进行 数据可视化 并人工分析瓶颈点。 父主题: 自动诊断工具MA-Advisor使用指导
  • IndexPut算子替换 在tensor类型的赋值和切片操作时,会使用IndexPut算子执行,一般都在AICPU上执行,可以转换为等价的tensor操作转换到CUBE单元上执行。例如: masked_input[input_mask] = 01 建议替换为: masked_input *= ~input_mask 1 此处是将IndexPut的masked_input是float类型的tensor数据,input_mask是和masked_input shape 一致的bool类型tensor或者01矩阵。由于是赋0操作,所以先对input_mask 取反后再进行乘法操作。 以赋0操作为例,在shape = (512, 32, 64) 类型float32 数据上测试,替换前耗时: 9.639978408813477 ms,替换之后耗时为 0.1747608184814453 ms Profiling分析算子下发发现,替换前:总体耗时在9.902ms,Host下发到device侧执行5个算子,其中aclnnIndexPutImpl_IndexPut_IndexPut是执行在 AICPU上。 图3 替换前 替换后:总体耗时226.131us。下发三个执行算子,均执行在AI CORE上。 图4 替换后
  • ArgMin算子优化 ArgMin在CANN 6.3 RC2 版本上 算子下发到 AICPU执行,在 CANN 7.0RC1上下发到AI_CORE 上边执行。出现此类情形建议升级 CANN 包版本。 在 shape 大小是 (1024, 1024) 的 tensor 上测试,结果如下: CANN 6.3.RC2上,单算子执行时间 2.603 ms。 图5 单算子执行时间(CANN 6.3.RC2) CANN7.0 RC1上,单算子执行时间 223.516 us。 图6 单算子执行时间(CANN7.0 RC1)
  • 自助诊断工具概述 弹性负载均衡自助问题诊断可以帮助您诊断健康检查异常问题,帮助您发现并解决常见问题,提升使用负载均衡的效率。实例诊断期间可能会对您指定的实例进行探测和诊断分析,不会对实例的正常配置和业务造成影响。 目前已支持对如表1所示的问题进行诊断。 自助问题诊断陆续上线中,已发布区域请参见自助问题诊断。 表1 负载均衡实例诊断说明 诊断问题 诊断说明 健康检查异常诊断 安全组规则配置:诊断后端服务器的安全组规则配置。 网络ACL规则配置:诊断后端服务器的网络ACL规则配置。 健康检查配置:诊断健康检查端口配置。 ELB计费问题 了解ELB的计费规则、变更ELB的规格和计费模式。 ELB的使用区别 了解ELB的功能特性差异。 父主题: 自助诊断工具