检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
看Service是否存在异常事件。 如果Service存在异常事件,可通过根据事件,参考根据Service异常事件排查查找异常的解决方案。 如果Service不存在异常事件,则一般为访问类问题或周边服务配置引入的问题,可参考根据常见问题对比排查查找异常的解决方案。 根据Service异常事件排查
检查项内容 该告警通常发生在低版本集群升级到v1.27及以上集群。CCE不建议您在1.27以上版本集群中继续使用docker,并计划在未来移除对docker的支持。 解决方案 若您的节点的运行时非containerd,您可通过节点重置功能重置节点的运行时为containerd。 如果您仍想在1
默认取值: 不涉及 X-Auth-Token 是 String 参数解释: 调用接口的认证方式分为Token和AK/SK两种,如果您使用的Token方式,此参数为必填,请填写Token的值,获取方式请参见获取token。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 响应参数
d容器数目。CPU资源的单Pod最小理论建议值为25m,Pod内单容器的最小理论建议值为25m/Pod容器数目。 您可在创建VPA任务时,通过配置containerPolicies字段为容器配置弹性资源上下限。 如果容器初始时同时配置了资源申请值与限制值,VPA计算后给出的建议值
自定义驱动,未指定驱动的节点将使用集群默认驱动。 系统将根据节点池指定的驱动版本进行安装,仅对节点池新建节点生效。 更新驱动版本后,新建节点直接生效,存量节点需重启节点生效。 安装2.7.2及以上版本的GPU插件时,支持以节点池级别配置XGPU虚拟化开关。 单击“确认配置”。 步骤二:创建GPU节点
最长为1年。 自动续费次数:勾选后,可设置自定义的续费次数,超出该次数后将不再自动续费。不设置自动续费次数时,默认为不限次数。 图1 设置自动续费 如果节点上绑定了EIP等资源,您可以通过勾选该资源决定是否随节点开通自动续费。 单击“开通”。 修改自动续费配置 登录CCE控制台,单击集群名称进入集群。
检查项内容 该告警通常发生在低版本集群升级到v1.27及以上集群。CCE不建议您在1.27以上版本集群中继续使用docker,并计划在未来移除对docker的支持。 解决方案 若您的节点池的运行时非containerd,您可通过更新节点池功能将节点池的运行时修改为containerd。 如果您仍想在1
ECS(节点)规格要求:CPU ≥ 2核且内存 ≥ 4GB。 通过搭建VPN方式访问CCE集群,需要注意VPN网络和集群所在的VPC网段、容器使用网段不能冲突。 网络限制 节点访问(NodePort)的使用约束:默认为VPC内网访问,如果需要通过公网访问该服务,请提前在集群的节点上绑定弹性IP。
具体集群参数。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 metadata 否 ClusterMetadataForUpdate object 参数解释: 集群基本信息,包含与名称相关的字段。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 表4 ClusterInformationSpec
项目ID,获取方式请参见如何获取接口URI中参数。 约束限制: 不涉及 取值范围: 账号的项目ID 默认取值: 不涉及 cluster_id 是 String 参数解释: 集群ID,获取方式请参见如何获取接口URI中参数。 约束限制: 不涉及 取值范围: 集群ID 默认取值: 不涉及 请求参数 无 响应参数 状态码:
加密磁盘的用户主密钥ID,长度为36字节的字符串,不填则无磁盘密钥ID限制。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 count 否 String 参数解释: 磁盘选择个数,不填则选择所有此类磁盘。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 表15 StorageGroups
检查Service是否可以正常访问容器内业务,检查集群内部可能存在的问题。 您可通过在集群中新建Pod并通过ClusterIP访问Service的方式进行检查,如您的服务为NodePort类型,也可通过EIP:Port使用互联网访问服务来验证。 通过kubectl连接集群,查询集群内服务。 # kubectl
缩”。 在“HPA策略”中,您可以根据业务需求,通过CPU利用率、内存利用率等指标自定义HPA策略以自动扩容CoreDNS。 图3 创建弹性伸缩策略 单击“创建”,当最新状态为“已启动”时,代表HPA自动扩容CoreDNS策略生效。 父主题: 服务端
度。 不涉及 最大采集文件数 单个节点所有日志采集规则监听的文件数不超过4095个文件。 不涉及 日志采集速率 插件低于1.5.0版本,每个集群限制单行日志采集速率不超过10000条/秒,多行日志不超过2000条/秒。 插件为1.5.0及以上版本,单节点限制日志采集速率不超过20000条/s、10MB/s。
annotation: kubernetes.io/elb.session-affinity-mode 不启用:不填写该参数。 开启会话保持:需增加该参数,取值“SOURCE_IP”,表示基于源IP地址。 不启用 允许 CCE Standard/CCE Turbo 支持基于源IP地址的简单会话保
项目ID,获取方式请参见如何获取接口URI中参数。 约束限制: 不涉及 取值范围: 账号的项目ID 默认取值: 不涉及 cluster_id 是 String 参数解释: 集群ID,获取方式请参见如何获取接口URI中参数。 约束限制: 不涉及 取值范围: 集群ID 默认取值: 不涉及 upgrade_workflow_id
监控GPU资源指标 通过Prometheus和Grafana,可以实现对GPU资源指标的观测。本文以实际示例介绍如何通过Prometheus查看集群的GPU显存的使用。 本文将通过一个示例应用演示如何监控GPU资源指标,具体步骤如下: 访问Prometheus (可选)为Prom
Master节点SSH连通性检查异常处理 检查项内容 该检查通过尝试建立SSH连接,检查CCE是否能通过SSH方式连接至您的Master节点。 解决方案 SSH连通性检查可能有较低概率因为网络波动检查失败,请您优先重试升级前检查; 若重试检查仍无法通过检查,请您提交工单,联系技术支持人员排查。 父主题:
表示此授权项对应的自定义策略,可以在IAM和企业管理两个服务中给用户组授权并生效。如果仅支持IAM项目,不支持企业项目,表示仅能在IAM中给用户组授权并生效,如果在企业管理中授权,则该自定义策略不生效。关于IAM项目与企业项目的区别,详情请参见:IAM与企业管理的区别。 “√”表示支持,“x”表示暂不支持。
本例中数据库为本地MySQL数据库,迁移后无需重新配置。若您通过数据复制服务DRS将本地数据库迁移至云数据库RDS,则在迁移后需重新配置数据库的访问,请您根据实际情况进行配置。 若云数据库RDS实例与CCE集群处于同一VPC下,则可通过内网地址访问,否则只能通过绑定EIP的方式进行公网访问。建议使用内