检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CCI提供基于Kubernetes原生类型的容器部署和管理能力,支持容器工作负载部署、配置、监控、扩容、升级、卸载、服务发现及负载均衡等生命周期管理。
存活探针:用于容器的自定义监控检查,如果检查失败,云容器实例将关闭该容器,然后根据默认重启策略来决定是否重启容器。详细步骤请参见健康检查。 生命周期:生命周期脚本定义,在容器的生命周期的特定阶段执行调用。详细步骤请参见容器生命周期。
存活探针:用于容器的自定义监控检查,如果检查失败,云容器实例将关闭该容器,然后根据默认重启策略来决定是否重启容器。详细步骤请参见健康检查。 生命周期:生命周期脚本定义,在容器的生命周期的特定阶段执行调用。详细步骤请参见容器生命周期。
同时,在“Pod列表>监控”Tab页中,可以看到各种资源的使用率。 父主题: GPU负载
CCI不提供nvidia-smi,您可以将nvidia-smi打包到镜像中,通过nvidia-smi监控GPU使用情况。使用nvidia-smi前需要设置LD_LIBRARY_PATH值,方法请参考为什么exec进入容器后执行GPU相关的操作报错。