检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU实例故障处理流程 GPU实例故障处理流程如图1所示,对应的操作方法如下: CES监控事件通知:配置GPU的CES监控后会产生故障事件通知。 故障信息收集:可使用GPU故障信息收集脚本一键收集,也可参考故障信息收集执行命令行收集。 GPU实例故障分类列表:根据错误信息在故障分类列表中识别故障类型。
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 监控安全风险 故障恢复 认证证书 擎天Enclave
创建在您的专属计算集群中。 开通专属云 申请专属计算集群资源 云监控 当用户开通了弹性云服务器后,无需额外安装其他插件,即可在云监控查看对应服务的实例状态。 弹性云服务器的监控指标 弹性云服务器中操作系统监控的监控指标 数据加密服务 加密功能依赖于数据加密服务。您可以在创建弹性云
请确保已重启云服务器使新密码生效。 检查云服务器负载是否过高 云服务器的带宽和CPU利用率过高可能会导致服务器无法登录。 如果您已经通过云监控服务创建过告警任务,当CPU或带宽利用率高时,系统会自动发送告警给您。 Windows弹性云服务器带宽流量过高或CPU利用率高,请参考Wi
请排除本地网络故障后重新测试访问网站。 检查云服务器CPU利用率 云服务器的带宽和CPU利用率过高可能导致网站无法访问。如果您已经通过云监控服务创建过告警任务,当CPU或带宽利用率高时,系统会自动发送告警给您。 定位影响云服务器带宽和CPU利用率高的进程。 Windows操作系
默认是10 monitor_items Vector 监控事物列表 表3 监控项参数解释 Variable Type Description name String 事物名称 monitor_type String 监控类型:file表示日志文件,resource表示资源使用 monitor_path
统等操作入口。 监控信息 云服务器运行相关的信息,包括CPU和网络使用情况。您可以选择页面左上方的时间范围按钮,查看该云服务资源“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”、“近30天”的监控原始数据曲线图。 监控信息总览 精简视图中监控视图总览从性能、
更改/etc/fstab时,必须执行systemctl daemon-reload。在运行该命令之前,systemd不读取fstab并生成装载单元。 处理方法 执行以下命令,重新加载systemd管理的unit配置。 systemctl daemon-reload 父主题: 磁盘空间管理
存不足,系统当前的线程数达到了配置的最大值。 处理方法 登录管理控制台。 通过ECS的主机监控功能的“内存使用率”指标,查看云服务器内存使用情况确认云服务器内存情况,详细操作,请参见查看监控指标 。 如果内存不足,建议扩容内存或者优化内存的使用,扩容内存可参考变更规格通用操作。 否则,执行步骤3。
添加弹性公网IP 修改带宽 安全组配置示例 配置安全组规则 资源管理 备份弹性云服务器 按需转包年/包月 管理云服务器标签 调整配额 运维与监控 查看监控指标 创建告警规则 支持云审计的关键操作 查看审计日志 常见问题 了解更多常见问题、案例和解决方案 热门案例 无法连接Windows实例怎么办?
由于共享型资源实例是多实例共享CPU,当资源不足时,实例间可能出现CPU资源争抢,导致云服务器卡顿。 云服务器的带宽和CPU使用率过高。 如果您已经通过云监控服务创建过告警任务,当CPU或带宽利用率高时,系统会自动发送告警给您。 当云服务器使用共享资源型实例时,您可以按如下步骤进行排查: 问题定
由于共享型资源实例是多实例共享CPU,当资源不足时,实例间可能出现CPU资源争抢,导致云服务器卡顿。 云服务器的带宽和CPU使用率过高。 如果您已经通过云监控服务创建过告警任务,当CPU或带宽利用率高时,系统会自动发送告警给您。 当云服务器使用共享资源型实例时,您可以按如下步骤进行排查: 问题定
由于共享型资源实例是多实例共享CPU,当资源不足时,实例间可能出现CPU资源争抢,导致云服务器卡顿。 云服务器的带宽和CPU使用率过高。 如果您已经通过云监控服务创建过告警任务,当CPU或带宽利用率高时,系统会自动发送告警给您。 当云服务器使用共享资源型实例时,您可以按如下步骤进行排查: 问题定
由于共享型资源实例是多实例共享CPU,当资源不足时,实例间可能出现CPU资源争抢,导致云服务器卡顿。 云服务器的带宽和CPU使用率过高。 如果您已经通过云监控服务创建过告警任务,当CPU或带宽利用率高时,系统会自动发送告警给您。 当云服务器使用共享资源型实例时,您可以按如下步骤进行排查: 问题定
如果缺少上述配置,请单击“添加用户或组”进行添加。 图3 允许通过远程桌面服务登录 检查用户的用户组属性。 在运行窗口输入lusrmgr.msc,打开"本地用户和组"配置管理单元。 双击左侧功能树中的“用户”节点,切换到用户管理。 双击出现访问异常的用户名。 在弹出的用户属性对话框中,切换到“隶属于”选项卡,确保用户隶属于上述2
如果缺少上述配置,请单击“添加用户或组”进行添加。 图3 允许通过远程桌面服务登录 检查用户的用户组属性。 在运行窗口输入lusrmgr.msc,打开"本地用户和组"配置管理单元。 双击左侧功能树中的“用户”节点,切换到用户管理。 双击出现访问异常的用户名。 在弹出的用户属性对话框中,切换到“隶属于”选项卡,确保用户隶属于上述2
GPU实例故障自诊断 GPU实例故障,如果已安装GPU监控的CES Agent,当GPU服务器出现异常时则会产生事件通知,可以及时发现问题避免造成用户损失。如果没有安装CES Agent,只能依赖用户对故障的监控情况,发现故障后及时联系技术支持处理。 GPU实例故障处理流程 GPU实例故障分类列表
绑定弹性公网IP请参考绑定弹性公网IP。 检查云服务器负载是否过高 当云服务器出现网络断开的情况,则可能是云服务器的带宽和CPU利用率过高导致。 如果您已经通过云监控服务创建过告警任务,当CPU或带宽利用率高时,系统会自动发送告警给您。 Linux弹性云服务器带宽流量过高或CPU利用率高,请参考Linux云服务器卡顿怎么办?进行排查。
auditd status 图1 运行状态 配置审计规则 执行以下命令配置监控文件和目录的更改。 auditctl -w /etc/passwd -p rwxa 其中, -w path : 指定要监控的路径,上面的命令指定了监控的文件路径 /etc/passwd -p : 指定触发审计的文件/目录的访问权限
弹性易用:根据业务需求和策略,自动调整弹性计算资源,高效匹配业务要求。 高效运维:提供控制台、远程终端和API等多种管理方式,给您完全管理权限。 云端监控:实时采样监控指标,提供及时有效的资源信息监控告警,通知随时触发随时响应。 负载均衡:弹性负载均衡将访问流量自动分发到多台云服务器,扩展应用系统对外的服务能力,实现更高水平的应用程序容错性能。