云服务器内容精选

  • 支持的事件监控 表1 CPH支持的事件监控 事件来源 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 CPH GPU故障 gpuAbnormal 致命 GPU发生故障 GPU故障,支持故障类型如下: "hard_hang" ----硬件故障,提交工单转运维处理 "over_temp" ----超温,提交工单转运维处理 "lost_card" ----显卡丢失,提交工单转运维处理 "light_reset_success" ----显卡轻量级reset成功,可能造成手机花屏,建议重启手机 "deep_reset_success" ----显卡重量级reset成功,可能造成该显卡下部分云手机花屏,建议重置显卡,或者提交工单转运维处理 "deep_reset_failed" ----显卡重量级reset失败,必须重启服务器才能恢复业务,或者提交工单转运维处理 "fan_damaged"----风扇损坏,必须重新更换显卡。提交工单转运维处理 业务中断 GPU恢复正常 gpuNormal 提示 GPU从故障中恢复正常 无需处理 无 内核崩溃 gpuNormal 致命 内核崩溃crash 提交工单转运维处理 crash期间业务中断 内核OOM kernelOom 重要 内核日志提示out of memory 提交工单转运维处理 业务中断 硬件故障 hardwareError 致命 内核日志报Hardware Error 提交工单转运维处理 业务中断 PCIe故障 pcieAer 致命 内核日志报PCIE Bus Error 提交工单转运维处理 业务中断 S CS I故障 scsiError 致命 内核日志报SCSI error 提交工单转运维处理 业务中断 镜像存储只读故障 partReadOnly 致命 镜像存储分区挂载属性变为readonly 提交工单转运维处理 业务中断 镜像存储超级块损坏故障 badSuperBlock 致命 镜像存储分区相关文件系统超级块损坏 提交工单转运维处理 业务中断 镜像存储sharedpath只读故障 isuladMasterReadOnly 致命 镜像存储的/.sharedpath/master挂载属性只读 提交工单转运维处理 业务中断 云手机数据盘只读故障 cphDiskReadOnly 致命 云手机数据盘挂载属性变为readonly 提交工单转运维处理 业务中断 云手机数据盘超级块损坏故障 cphDiskReadOnly 致命 云手机数据盘相关文件系统超级块损坏 提交工单转运维处理 业务中断 父主题: 使用 CES 监控CPH