检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何规划集群中虚拟私有云VPC和子网网段? 是否可以直接连接Kubernetes的master节点? 更多 集群类 集群状态为“不可用”,如何解决? 创建集群时,集群管理规模不同时,对应的master节点数量不同吗? 如何排查已创建的集群是否为高可用集群? 包周期的CCE集群到期可以直接删除吗?
pathType: ImplementationSpecific ingressClassName: cce 表1 慢启动参数说明 参数 是否必填 参数类型 描述 kubernetes.io/elb.slowstart 否 String 负载均衡器向慢启动模式下的后
访问5443端口。5443端口默认对所有网段放通,如果您对安全组做过加固,当出现在CloudShell中无法访问集群时,请检查5443端口是否放通了198.19.0.0/16网段。 集群必须安装CoreDNS才能使用CloudShell。 当前仅北京一、北京四、上海一、上海二、广
进行手动安装,详细操作请参见Docker Engine installation。 dnf install docker 查看Docker是否安装成功。 docker info Gitlab安装及配置 拉取 Gitlab 镜像。 docker pull gitlab/gitlab-ce
集群诊断健康提炼了运维专家提供的高频故障案例,分别从如下方面进行检查: 维度 检查项 运维层面 集群运维能力 集群安全组配置正确性 集群资源规划合理性 租户配额是否充足 资源与业务层面 存储插件(everest)健康程度 日志采集插件(log-agent)健康程度 域名解析插件(coredns)健康程度
release信息存储在configmap中,Helm v3 release信息存储在secrets中。 若用户通过前端console操作,在获取实例、更新实例等操作中CCE会自动尝试转换v2模板实例到v3模板实例。若用户仅在后台操作实例,需通过该指南进行转换操作。 转换流程(不使用Helm v3客户端)
云原生2.0网络目前支持以下网卡预热策略:节点容器网卡动态预热策略和节点绑定容器网卡数总量高低水位策略(废弃中)。使用场景如下表所示: 表1 容器网卡预热策略对比表 容器网卡预热策略 节点容器网卡动态预热策略(默认策略) 节点绑定容器网卡数总量高低水位策略(废弃中) 管理策略 节点最少
org/wikipedia/commons/thumb/c/c5/Nginx_logo.svg/500px-Nginx_logo.svg.png keywords: - ingress - nginx kubeVersion: '>=1.20.0-0' maintainers: - name: rikatz
截kubelet的删除行为,导致kubelet在定期回收镜像过程中出现失败。 解决方法 登录节点上执行以下命令,过滤出告警提示的容器,确认是否处于exited状态。其中{containerId}需要替换为告警中提到的容器ID。 节点使用docker运行时: docker ps -a
dir=obs://{bucket-name}/{log-dir}/ EOF spark.eventLog.enabled:设置为true,表示开启Spark事件日志记录。 spark.eventLog.dir:OBS桶名称及路径,格式为obs://{bucket-name}/{l
击该安全组名称配置规则。 切换至“出方向规则”页签,并单击“添加规则”,为安全组添加出方向规则。 优先级:设置为1。 策略:选择“拒绝”,表示禁止访问目标地址。 类型:选择“IPv4”。 协议端口:根据内网apiserver地址中的端口,填写“5443”。 目的地址:选择“IP地
${storageDevice} evs云盘通过matchLabels字段去模糊匹配dataVolumes字段中创建的云盘。 matchLabels的匹配存在优先级,storageSelectors中靠前的策略优先匹配,dataVolumes中靠前的云盘也优先被选择。由于matchLabels采
不支持外部网络与容器IP直接进行网络通信。 应用场景 对性能要求不高:由于需要额外的VXLAN隧道封装,相对于另外两种容器网络模式,性能存在一定的损耗(约5%-15%)。所以容器隧道网络适用于对性能要求不是特别高的业务场景,比如:Web应用、访问量不大的数据中台、后台服务等。
如果不满足如上两个条件,EulerOS 2.5、CentOS 7.6、Ubuntu 18.04上kernel.pid_max默认值32768。 表1 节点kernel.pid_max默认值 操作系统 1.17.9及以下版本集群 1.17.17及以上版本集群 2022年1月30日及之前创建的节点
在欧洲地区有业务的用户,可以选择“欧洲-巴黎”区域。 资源的价格 不同区域的资源价格可能有差异,请参见华为云服务价格详情。 如何选择可用区? 是否将资源放在同一可用区内,主要取决于您对容灾能力和网络时延的要求。 如果您的应用需要较高的容灾能力,建议您将资源部署在同一区域的不同可用区内。
登录CCE控制台。 单击集群名称进入集群,在左侧选择“配置中心”,在右侧选择“调度配置”页签。 在“AI任务性能增强调度”配置中,选择是否开启“公平调度 (drf) ”。 启用该能力后,可增强集群业务的吞吐量,提高业务运行性能。 修改完成后,单击“确认配置”。 父主题: AI任务性能增强调度
default-secret schedulerName: volcano 表1 关键参数说明 参数 是否必选 描述 volcano.sh/gpu-mem.128Mi 否 该数值表示128Mi的倍数,需为正整数,显存值单位为MiB。若配置的显存超过单张GPU卡的显存,将会出现无法调度状况。
户类型在ServiceAccount有过介绍。绑定后的关系如下图所示。 图2 RoleBinding绑定Role和用户 下面来验证一下授权是否生效。 在前面一个章节使用ServiceAccount中,创建一个Pod,使用了sa-example这个ServiceAccount,而刚
theus的规范。 部署应用并转换指标 在集群中使用该应用镜像部署工作负载,将自动上报自定义监控指标。 配置验证 前往AOM查看自定义指标是否采集成功。 约束与限制 ICAgent兼容Prometheus的监控数据规范,Pod提供的自定义指标必须满足Prometheus的监控数据
printf \"%.2f\" $value }}%" 配置成功后,可以访问Prometheus的Web页面,在“Alert”页面查询告警规则是否触发或者生效。 Prometheus插件将自动推送告警至Alertmanager,如果想配置告警的接收方,可以通过配置monitoring