检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云容器实例提供了查看CPU/内存、GPU/显存的界面,您只需要在无状态负载、任务、定时任务中Pod列表的“监控”Tab下即可查看资源使用率,如图1所示。 您也可以在Pod管理中查看所有Pod的资源使用率。 图1 查看监控信息 父主题: 工作负载
选择“云原生监控插件”,单击“安装”。 图1 安装云原生监控插件 在安装插件页面,进行规格配置,部署模式选择“Server模式”。 如果需要在Agent部署模式下使用HPA功能,请联系技术支持人员。 通过云原生监控插件,提供系统资源指标。
IAM是云平台提供权限管理的基础服务,无需付费即可使用,您只需要为您账号中的资源进行付费。 关于IAM的详细介绍,请参见IAM产品介绍。 CCI服务暂不支持Landingzone场景。
除此之外,您还可以实时查看监控指标及审计日志,以便及时了解容器中应用健康状况。
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 监控安全风险
CCE突发弹性引擎(对接CCI) bursting插件功能概览 快速使用 调度负载到CCI 资源配额 镜像 存储 网络 日志 监控 弹性伸缩 常见问题 父主题: 云原生bursting
负载管理 CCI应用进行优雅滚动升级 在容器中通过环境变量获取Pod基础信息 内核参数配置 修改/dev/shm容量大小 使用Prometheus监控CCI实例
应用容器状态监控 提供容器健康状态检查和容器的运行时指标实时监控。 数据持久化存储 支持挂载网络存储卷,保障业务数据持久化存储。 父主题: 基本概念类
图2 选择Pod来源 您可以查看到所有Pod详情,包括基本信息、Pod中容器组成、Pod的监控信息、事件,以及使用远程终端访问Pod。您还可以对Pod进行删除操作,并查看Pod的日志。
基础配置 Fluent Bit是一个开源的多平台日志处理器工具,Fluent Bit配置由SERVICE,INPUT,FILTER,PARSER,OUTPUT等模块组成,目前我们只允许定义OUTPUT模块,在OUTPUT中定义日志内容的目的端。
存活探针:用于容器的自定义监控检查,如果检查失败,云容器实例将关闭该容器,然后根据默认重启策略来决定是否重启容器。详细步骤请参见健康检查。 生命周期:生命周期脚本定义,在容器的生命周期的特定阶段执行调用。详细步骤请参见容器生命周期。
日志管理 云容器实例支持挂载日志存储卷采集日志,您只需要在创建负载的时候添加日志存储卷,即可将日志写入到日志存储卷中。 业务运行性能不达预期,可能是日志量过大的原因,详细请参见为什么业务运行性能不达预期。 云容器实例对接了应用运维管理(Application Operations
存活探针:用于容器的自定义监控检查,如果检查失败,云容器实例将关闭该容器,然后根据默认重启策略来决定是否重启容器。详细步骤请参见健康检查。 生命周期:生命周期脚本定义,在容器的生命周期的特定阶段执行调用。详细步骤请参见容器生命周期。
CCI提供基于Kubernetes原生类型的容器部署和管理能力,支持容器工作负载部署、配置、监控、扩容、升级、卸载、服务发现及负载均衡等生命周期管理。
同时,在“Pod列表>监控”Tab页中,可以看到各种资源的使用率。 父主题: GPU负载
CCI不提供nvidia-smi,您可以将nvidia-smi打包到镜像中,通过nvidia-smi监控GPU使用情况。使用nvidia-smi前需要设置LD_LIBRARY_PATH值,方法请参考为什么exec进入容器后执行GPU相关的操作报错。
使用OBS存储挂载失败 问题现象: 单击“工作负载 > 任务 ”,实例状态显示“失败”。 图1 Pod状态 单击“事件”页,查看异常事件,如下图: 图2 事件类型异常 在Pod列表,单击失败实例后的“查看日志”,跳转到应用运维管理AOM界面。 图3 Pod列表 在应用运维管理AOM
创建用户并授权使用CCI 如果您需要对您所拥有的云容器实例(CCI)进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的云账号中,给企业中不同职能部门的员工创建IAM
网络 简介 通过阅读本章节用户可以了解: 如何为弹性CCI的pod配置默认使用的指定dns服务器。 CCE集群pod与CCI集群中pod通过service互通的使用指导。 弹性CCI侧pod通过service发布。 约束与限制 使用共享VPC的CCE集群不支持开启“网络互通”功能。
升级负载 负载创建成功后,可以对负载更新和升级。当前支持“滚动升级”和“替换升级”两种方式。 滚动升级:将逐步用新版本的实例替换旧版本的实例,升级的过程中,业务流量会同时负载均衡分布到新老的实例上,因此业务不会中断。 替换升级:将先把您工作负载的老版本实例删除,再安装指定的新版本,