检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
theus。 图1 访问Prometheus 单击“Status > Targets”,可以查看到Prometheus监控了哪些目标。 图2 查看监控目标 监控GPU指标 创建一个使用GPU的工作负载,等工作负载正常运行后,访问Prometheus,在“Graph”页面中,查看GPU指标。
擎的节点,其中Containerd容器引擎的节点要求ICAgent版本为5.12.130及以上。 容器文件日志采集目前仅支持overlay2存储驱动,不支持Device Mapper作为存储驱动的节点。 详细限制说明请参见CCE接入 > 约束限制。 每个工作负载需单独配置。 日志
通过云容器引擎服务创建的集群,Master节点将由云容器引擎服务托管,您只需创建Node节点。 Kubernetes集群的架构如下所示: 图2 Kubernetes集群架构 Master节点 Master节点是集群的控制节点,由API Server、Scheduler、Controller
网络型规格。 须知: 开启公网访问将会把Grafana服务暴露至公网,建议评估安全风险并做好访问策略的管控。 设置插件实例的部署策略。 表2 插件调度配置 参数 参数说明 节点亲和 不配置:插件实例不指定节点亲和调度。 指定节点调度:指定插件实例部署的节点。若不指定,将根据集群默认调度策略进行随机调度。
# 对象存储大小 storageClassName: csi-obs # StorageClass类型为对象存储 表2 关键参数说明 参数 是否必选 描述 everest.io/obs-volume-type 是 对象存储类型。 fsType设置为s3fs时
析,会导致集群内部域名解析失败的情况。 hosts的详细配置请参见https://coredns.io/plugins/hosts/。 图2 修改CoreDNS Hosts配置 对应Corefile内容如下: .:5353 { bind {$POD_IP} hosts
# SFS Turbo存储类名称 mountOptions: [] # 挂载参数 表2 关键参数说明 参数 是否必选 描述 volumeHandle 是 使用整个SFS Turbo创建PV时,填写极速文件存储的ID。 获取方法:在CCE控制台,单击顶部的“服务列表
折扣券不退还。 登录CCE控制台,在左侧导航栏中选择“集群管理”。 找到需要退订的集群,查看集群的更多操作,并单击“退订”或“释放”。 图2 集群退订 在弹出的“退订”或“释放”页面中,勾选要释放的资源。 删除集群节点,可支持以下操作选项: 保留:保留服务器、系统盘和数据盘数据。
并且可以和HPA策略共同作用,定时调整HPA伸缩范围,实现复杂场景下的工作负载伸缩。 创建CronHPA定时策略 节点弹性伸缩类型介绍 表2 节点弹性伸缩类型 组件名称 组件介绍 适用场景 参考文档 CCE集群弹性引擎 Kubernetes社区开源组件,用于节点水平伸缩,CCE在
制作并上传镜像 本章指导用户将整体应用制作成Docker镜像。制作完镜像后,每次应用的部署和升级即可通过镜像操作,减少了人工配置,提升效率。 制作镜像时,要求制作镜像的文件在同个目录下。 使用云服务 容器镜像服务SWR:是一种支持容器镜像全生命周期管理的服务, 提供简单易用、安全
search.suffix options: - name: ndots value: "2" - name: edns0 场景2:采用kubernets的DNS插件CoreDNS 优先使用Kubernetes的DNS服务解析,失败后再使用外部级联的DNS服务解析。
以下所有第三方教程均来自于华为云社区。由于云容器引擎产品持续更新与迭代,开发者社区教程中的步骤可能存在时效性,不一定与产品最新操作步骤完全保持一致,相关内容仅供学习和参考。 表2 开发者社区精选最佳实践 分类 相关文档 Kubernetes生态相关 CCE集群命名空间级别子账号权限配置 使用Terraform部署华为云和Kubernetes资源
---- ---- ------- Normal Scheduled 0s (x3 over 2s) volcano pod group is ready 父主题: Volcano调度
存储类名称,csi-sfs表示使用通用文件系统(SFS 3.0) mountOptions: [] # 挂载参数 表2 关键参数说明 参数 是否必选 描述 everest.io/reclaim-policy 否 目前仅支持配置“retain-volume-only”
wsize=1048576,namlen=255,hard,nolock,noresvport,proto=tcp,timeo=600,retrans=2,sec=sys,mountaddr=**.**.**.**,mountvers=3,mountport=2050,mountproto=tcp
得该权限。 CCE LTS Administrator 监控中心、告警中心在运行过程中需要访问LTS获取日志信息,因此需要获得该权限。 表2 aom_admin_trust优化前权限 授权类型 权限名称 描述 AOM DMS UserAccess AOM支持用户通过DMS获取数据订阅的功能,因此需要获得该权限。
80: icmp_seq=1 ttl=64 time=1.08 ms 64 bytes from 10.0.1.80: icmp_seq=2 ttl=64 time=0.337 ms 继续访问华为云域名,能够看到已经解析出对应的IP地址,说明能够解析。 # ping cce.cn-east-3
得该权限。 CCE LTS Administrator 监控中心、告警中心在运行过程中需要访问LTS获取日志信息,因此需要获得该权限。 表2 aom_admin_trust优化前权限 授权类型 权限名称 描述 AOM DMS UserAccess AOM支持用户通过DMS获取数据订阅的功能,因此需要获得该权限。
NVIDIA Container Toolkit容器逃逸漏洞公告(CVE-2024-0132) NVIDIA Container Toolkit 是一个由 NVIDIA 提供的开源工具包,它允许您在容器化环境中利用 NVIDIA GPU 进行加速计算。工具包包括一个容器运行时库和
CPU限制值 内存申请值 内存限制值 50 2500QPS 2 500m 500m 512Mi 512Mi 200 5000QPS 2 1000m 1000m 1024Mi 1024Mi 1000 10000QPS 2 2000m 2000m 2048Mi 2048Mi 2000