检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
弹性云服务器支持的进程监控指标(安装Agent) 功能说明 通过在弹性云服务器中安装Agent插件,可以对主机内的活跃进程进行监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 本节定义了弹性云服务器上报云监控的进程监控指标。 命名空间 AGT.ECS 进程监控指标说明 对
AI推理加速型系列:搭载自研昇腾310芯片,为AI推理业务加速。 AI加速型实例总览 AI推理加速增强I型Ai1s AI推理加速I型Ai1 表1 AI加速型实例特点 规格名称 计算 磁盘类型 网络 Ai1s CPU/内存配比:1:4/1:2 vCPU数量范围:2-32 处理器:第二代英特尔®
设置告警规则 操作场景 通过设置弹性云服务器告警规则,用户可自定义监控目标与通知策略,及时了解弹性云服务器运行状况,从而起到预警作用。 设置弹性云服务器的告警规则包括设置告警规则名称、监控对象、监控指标、告警阈值、监控周期和是否发送通知等参数。本节介绍了设置弹性云服务器告警规则的具体方法。
注册云服务器监控(废弃) 功能介绍 将云服务器添加到监控表中。 注册到监控表中的云服务会被ceilometer周期性采集监控数据,包括平台的版本、cpu信息、内存、网卡、磁盘、硬件平台等信息,这些数据上报给云监控。例如SAP云服务器内部的插件会周期性从云监控中查询监控数据,以报表形式呈现给SAP。
鲲鹏AI推理加速型 鲲鹏AI推理加速型云服务器是专门为AI业务提供加速服务的云服务器。搭载昇腾系列芯片及软件栈。 该类型弹性云服务器默认未开启超线程,每个vCPU对应一个底层物理内核。 鲲鹏AI推理加速型系列:搭载自研昇腾310芯片,为AI推理业务加速。 表1 鲲鹏AI推理加速型实例特点
触发“调整配置”提醒的阈值为:云服务器在最近72小时内,开机时间超过36小时,且“CPU使用率”的中位数超过75%。 关于监控指标“CPU使用率”的详细描述,请参见弹性云服务器支持的基础监控指标。 本章节介绍当云服务器CPU偏高、超过阈值时,系统提示调整配置时的操作指导。 变更须知 当云服务器状态为“已冻结”时,不支持变更规格。
查询事件 操作场景 本文介绍如何通过弹性云服务器的控制台查询系统上报的事件。 您还可以通过云监控服务的“事件监控”查看ECS实例的事件,详细内容请参见查看事件监控数据。 前提条件 如果您通过IAM用户进行本操作,则需要在操作前对IAM用户进行授权。 查询及响应事件操作依赖以下策略:
GPU实例故障处理流程 GPU实例故障处理流程如图1所示,对应的操作方法如下: CES监控事件通知:配置GPU的CES监控后会产生故障事件通知。 故障信息收集:可使用GPU故障信息收集脚本一键收集,也可参考故障信息收集执行命令行收集。 GPU实例故障分类列表:根据错误信息在故障分类列表中识别故障类型。
怎样查看我的配额? 如何申请扩大配额? 监控云服务器 监控是保持弹性云服务器可靠性、可用性和性能的重要部分,通过监控,用户可以观察弹性云服务器资源。为使用户更好地掌握自己的弹性云服务器运行状态,公有云平台提供了云监控。您可以使用该服务监控您的弹性云服务器,执行自动实时监控、告警和通知操作,帮助您更好地了解弹性云服务器的各项性能指标。
ved Nginx高可用Web集群方案进行部署。 操作维护管理 监控管理 为了使用户能够及时获取弹性云服务器的各项性能指标及运行状态,建议您使用云监控服务,执行自动实时监控、告警和通知操作。 详细内容,请参见云监控服务。 关键操作管理 为了能够对弹性云服务器的操作进行查询、审计和
远程连接Linux云服务器报错:Authentication failed 问题描述 非root账号通过SSH方式远程登录Linux服务器报错:Authentication failed。 Your account has expired;please contact your system
添加弹性公网IP 修改带宽 安全组配置示例 配置安全组规则 资源管理 备份弹性云服务器 按需转包年/包月 管理云服务器标签 调整配额 运维与监控 查看监控指标 创建告警规则 支持云审计的关键操作 查看审计日志 常见问题 了解更多常见问题、案例和解决方案 热门案例 无法连接Windows实例怎么办?
基础监控 基础监控无需安装Agent,是ECS自动上报的监控指标。基础监控指标的监控周期为5分钟(KVM实例)。 操作系统监控 操作系统监控需要在弹性云服务器中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。操作系统监控的监控周期为1分钟(KVM实例)。 购买云服务器时的开启操作系统监控的方法:
pip安装软件时出现错误:command ´gcc´ failed with exit status 1 问题描述 安装Python库软件时,需配置pip源。以中国科技大学镜像源为例: [root@test home]# cat /root/.pip/pip.conf [global]
成本中心可以通过监控云服务器的历史消费情况和CPU使用率,为客户提供云服务器资源的空闲识别和优化建议,寻找节约成本的机会。您还可以根据成本分析阶段的分析结果识别成本偏高的资源,通过云监控服务监控资源的使用情况,确定成本偏高的原因,然后采取针对性的优化措施。 监控资源利用率,评估当
启动弹性云服务器时卡在“Waiting for cloudResetPwdAgent” 问题描述 启动弹性云服务器时,系统长时间卡在“Waiting for cloudResetPwdAgent”状态,需要等待20s~30s,如图1所示。 图1 启动cloudResetPwdAgent
/var/log/secure查看secure日志,发现类似如下错误信息。 sshd.service: main process exited, code=exited, status=203/EXEC. init: ssh main process (1843) terminated with status
temporarily unavailable xxxxsshd2[28377]: Disconnecting: fork failed: Resource temporarily unavailable xxxxsshd2[4484]: Disconnecting: fork failed: Resource
提供对用户云环境的安全评估,帮助用户快速发现安全弱点和威胁,同时提供安全配置检查,并给出安全实践建议,有效减少或避免由于网络中病毒和恶意攻击带来的损失。 智能化进程管理 提供智能的进程管理服务,基于可定制的白名单机制,自动禁止非法程序的执行,保障弹性云服务器的安全性。 漏洞扫描 支持通用Web漏洞检测、第
Linux云服务器启动时提示报错:Failed to load SELinux policy, freezing. 问题描述 Linux云服务器启动后提示“Failed to load SELinux policy, freezing. ”错误,具体报错信息如下图所示。 可能原因