检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建对等连接-参数说明 参数 说明 取值样例 对等连接名称 必选参数。 此处填写对等连接的名称。 由中文字符、英文字母、数字、中划线、下划线等构成,一般不超过64个字符。 peering-AB 本端VPC 必选参数。 此处为对等连接一端的VPC,可以在下拉框中选择已有VPC作为本端VPC。
插件模板名称,如coredns addonTemplateType String 插件模板类型 addonTemplateLogo String 插件模板logo图片的地址 addonTemplateLabels Array of strings 插件模板所属类型 description String 插件模板描述
连续探测1次成功表示成功 failureThreshold: 3 # 连续探测3次失败表示失败 initialDelaySeconds一般要设置大于0,这是由于很多情况下容器虽然启动成功,但应用就绪也需要一定的时间,需要等就绪时间之后才能返回成功,否则就会导致probe经常失败。
com/helm/charts的stable目录中查找您需要的chart包,下载后将chart包上传至节点。 下载并解压已获取的chart包,一般chart包格式为.zip。 unzip chart.zip 安装Helm模板。 helm install aerospike/ 安装完成后,执行helm
插件模板名称,如coredns addonTemplateType String 插件模板类型 addonTemplateLogo String 插件模板logo图片的地址 addonTemplateLabels Array of strings 插件模板所属类型 description String 插件模板描述
量进行自定义调整。其中,插件组件的CPU和内存申请值可根据集群节点规模和PVC数量不同进行调整,配置建议请参见表2。 非典型场景下,限制值一般估算公式如下: everest-csi-controller: CPU限制值:200及以下节点规模设置为250m;1000节点规模设置为3
创删负载现象,在大量容器频繁创删过程中有可能出现大量异常容器且难以及时清理。 在此场景下可考虑停止重复创删负载或采用更多的节点去分摊负载,一般等待一段时间后节点会恢复正常,必要情况可执行docker rm {container_id}手动清理异常容器。 排查项十一:包周期节点退订
Failed 失败 Error 错误 expireTimeStamp String 检查结果过期时间 message String 信息,一般是执行错误的日志信息 clusterCheckStatus clusterCheckStatus object 集群限制检查状态 addonCheckStatus
Failed 失败 Error 错误 expireTimeStamp String 检查结果过期时间 message String 信息,一般是执行错误的日志信息 clusterCheckStatus clusterCheckStatus object 集群限制检查状态 addonCheckStatus
版本号。 swr.cn-east-3.myhuaweicloud.com是仓库地址,每个区域的地址不同。 container是组织名,组织一般在SWR中创建,如果没有创建则首次上传的时候会自动创建,组织名在单个区域内全局唯一,需要选择合适的组织名称。 v1则是hello镜像分配的版本号。
Failed 失败 Error 错误 expireTimeStamp String 检查结果过期时间 message String 信息,一般是执行错误的日志信息 clusterCheckStatus clusterCheckStatus object 集群限制检查状态 addonCheckStatus
require Boolean 是否为必安装插件 labels Array of strings 模板所属分组 logoURL String Logo图片地址 readmeURL String 插件详情描述及使用说明 description String 模板描述 versions Array
前集群下节点的可用区数量,同时由于限制单个可用区最多一个实例,实例所在节点的故障后,故障实例无法自动迁移到同可用区下的其他节点。 强制模式一般用于可用区数量后续有变动场景,避免所有实例都提前调度到当前的可用区节点上。 均分模式 插件实例配置Pod拓扑分布约束,拓扑域为可用区级别(topology
享受的折扣越大。 一般适用于设备需求量长期稳定的成熟业务。 按需计费 一种后付费模式,即先使用再付费,按照云服务器实际使用时长计费,秒级计费,按小时结算。按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。 一般适用于电商抢购等设备需求量瞬间大幅波动的场景。
如果Service存在异常事件,可通过根据事件,参考根据Service异常事件排查查找异常的解决方案。 如果Service不存在异常事件,则一般为访问类问题或周边服务配置引入的问题,可参考根据常见问题对比排查查找异常的解决方案。 根据Service异常事件排查 不同异常事件的解决方法如下表所示:
容器引擎,详情请参见Kubernetes即将移除Dockershim,CCE v1.27版本中也将不再支持Docker容器引擎。 因此,在一般场景使用时建议选择Containerd容器引擎。但在以下场景中,仅支持使用Docker容器引擎: Docker in Docker(通常在CI场景)。
扩充指标白名单范围直接编辑对应的ServiceMonitor/PodMonitor即可。 此处经过编辑的ServiceMonitor/PodMonitor配置在升级插件时一般不会受影响,但是不排除被覆盖的可能。升级插件前请备份相关修改,并于升级后手动确认。 扩充cadiviser指标 执行如下命令,编辑ServiceMonitor
集群的Pod IP或节点。 多网络模式集群并存场景 在不同网络模式集群间需要跨VPC互访的情况下,每种类型的集群均可能作为请求端和目的端。一般情况下需遵循以下规律: 集群所属的VPC地址段需要避免和对端集群的VPC地址段重叠。 集群子网网段尽量避免和自身的容器网段重叠。 集群间的容器网段需要避免相互重叠。
当插件状态处于“未知状态”且对应插件返回信息的status.Reason字段为"don't install the addon in this cluster"时,一般为集群中对应插件的helm release关联secret被误删导致,此类场景可先卸载插件,然后以相同配置参数重新安装插件恢复。 插件相关操作
解码器利用率 表2 内存指标 指标名称 指标类型 单位 说明 DCGM_FI_DEV_FB_FREE Gauge MB 表示帧缓存剩余数,帧缓存一般被称为显存 DCGM_FI_DEV_FB_USED Gauge MB 表示帧缓存已使用数,该值与nvidia-smi命令中memory-usage的已使用值对应