检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Pod列表 CCI控制台上的资源监控信息仅展示CPU使用率和内存使用率。您可前往应用运维管理服务AOM查看更多监控指标。 单击监控页签下方的“查看更多”,进入AOM控制台。 图2 Pod监控 单击,在视图模板中添加曲线图。 图3 视图模板 选择页面左侧系统指标,例如:选择“CPU使用率”,点击确认。
od的监控不受影响。 操作步骤 登录CCE控制台。 选择CCE集群,单击进入CCE集群总览页面。 在导航栏左侧单击“监控中心”,进入监控中心首页。 单击“立即开通”。 在导航栏左侧单击“工作负载”,进入工作负载首页。 单击工作负载对应的右侧操作“监控”按钮。 查看负载监控指标,详情请参考云原生监控插件。
CCI支持Pod资源基础监控能力,提供CPU、内存、磁盘、网络等多种监控指标,满足对Pod资源的基本监控需求。 Pod内置系统agent,默认会以http服务的形式提供Pod和容器的监控指标。 CCI支持的资源监控指标,请参见资源监控指标。 Pod资源基础监控能力,请参见Pod资源监控指标。 父主题:
使用Prometheus监控CCI实例 为实现CCI用户对部署的应用负载进行基础资源监控和自定义监控,我们提供了Prometheus对接CCI实例监控的能力,您可以手动部署Prometheus插件,直接使用Prometheus作为监控平台,对命名空间中部署的应用负载进行实时监控。 Prome
Pod资源监控指标 CCI支持Pod资源基础监控能力,提供CPU、内存、磁盘、网络等多种监控指标,满足对Pod资源的基本监控需求。 Pod内置系统agent,默认会以http服务的形式提供Pod和容器的监控指标。agent集成到Pod里面,会占用Pod内资源,建议您预留30MB的内存。
带宽>6MB/s,iops>1000)或者对磁盘IO性能比较敏感,请不要将大IO的文件操作放在rootfs,例如往容器系统盘(rootfs磁盘)高频打日志,使系统盘频繁读写,您可以将业务相关的配置文件,或者一些读写不频繁的文件放在rootfs磁盘中。大IO的文件操作需要根据业务场
性扩缩容。 应用高可用保障 支持多实例同时对外提供服务,保障用户业务高可靠,并提供全局负载均衡能力。 应用容器状态监控 提供容器健康状态检查和容器的运行时指标实时监控。 数据持久化存储 支持挂载网络存储卷,保障业务数据持久化存储。 父主题: 基本概念类
CCE突发弹性引擎(对接CCI) bursting插件功能概览 快速使用 调度负载到CCI 资源配额 镜像 存储 网络 日志 监控 弹性伸缩 常见问题 父主题: 云原生bursting
云容器实例支持用户自定义弹性伸缩策略,且能在1秒内实现弹性扩缩容,并可以自由组合多种弹性策略以应对业务高峰期的突发流量浪涌。 全方位容器状态监控 云容器实例支持监控容器运行的资源使用率,包括CPU、内存、GPU和显存的使用率,方便您实时掌控容器运行的状态。 产品架构 云容器实例提供Serverless
s集群,支持运行容器,提供了Kubernetes集群管理、容器应用全生命周期管理、应用服务网格、Helm应用模板、插件管理、应用调度、监控与运维等容器全栈能力,为您提供一站式容器平台服务。借助云容器引擎,您可以在华为云上轻松部署、管理和扩展容器化应用程序。 详细介绍请查看什么是云容器引擎。
云容器实例提供了查看CPU/内存、GPU/显存的界面,您只需要在无状态负载、任务、定时任务中Pod列表的“监控”Tab下即可查看资源使用率,如图1所示。 您也可以在Pod管理中查看所有Pod的资源使用率。 图1 查看监控信息 父主题: 工作负载
共享镜像:展示了容器镜像服务中他人共享的镜像。 镜像选择完成后,需要选择镜像的版本、设置容器名称、设置容器占用的CPU和内存规格,并选择是否开启采集标准输出文件(开启后,应用运维管理AOM将根据实际使用量进行计费)。 每个租户一个月有500M的免费日志存储空间,超过500M时AOM将根据实际使用量进行收费,计费规则请参见产品价格详情。
负载管理 CCI应用进行优雅滚动升级 在容器中通过环境变量获取Pod基础信息 内核参数配置 修改/dev/shm容量大小 使用Prometheus监控CCI实例
本章节,可以使用云原生监控插件替换metrics-server插件,以使HPA功能正常。 操作步骤 安装“云原生监控插件”。 登录CCE控制台。 选择CCE集群,单击进入CCE集群总览页面。 在导航栏左侧单击“插件中心”,进入插件中心首页。 选择“云原生监控插件”,单击“安装”。
本、免运维的计算平台。科学计算一般都是任务型计算,快速申请大量资源,完成后快速释放。 云容器实例提供如下特性,能够很好的支持这类场景。 高性能计算:提供高性能计算、网络和高I/O存储,满足密集计算的诉求 极速弹性:秒级资源准备与弹性,减少计算过程中的资源处理环节消耗 免运维:无需
用容错。 您可以通过弹性负载均衡,从外部网络访问容器负载。 应用运维管理 应用运维管理(Application Operations Management,AOM)为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。
使用容器化的方式做此类人工智能训练与推理有如下优势: 容器化消除环境差异,不需要自己安装各种软件和配套版本,如python,tensorflow,cuda toolkit等软件。 GPU驱动免安装。 低成本,按秒计费。 serverless带来的免VM运维。 镜像制作 tensor
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 监控安全风险
容。除此之外,您还可以实时查看监控指标及审计日志,以便及时了解容器中应用健康状况。 常用操作 命名空间 无状态工作负载(Deployment) 容器启动命令 容器生命周期 健康检查 远程终端 负载访问 内网访问 公网访问 从容器访问公网 运维与监控 日志管理 云审计服务支持的CCI操作列表
支持弹性CCI的负载通过CCE Log Collector上报日志。 支持日志自动转储。 日志 监控 用户可以通过配置插件对接监控平台,提升弹性CCI工作负载的可观测性。 支持对接AOM。 支持对接普罗米修斯。 监控 资源使用说明 CCE集群+bursting的使用场景涉及到华为云周边服务的搭配