检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用通用文件存储(SFS 3.0)自动收集异常退出的JVM转储文件 当您使用Java开发业务时,如果设置的JVM堆空间过小,程序可能会出现OOM(Out Of Memory)问题。为了解决这个问题,您可以使用通用文件存储(SFS 3.0)作为记录日志的载体,并将其挂载到容器内的相
s_per_second的指标用来标识容器内存工作集每秒字节。关于Prometheus指标的更多信息,请参见metric_type。 部署测试应用。 创建sample-app.yaml文件,内容如下: apiVersion: apps/v1 kind: Deployment metadata:
alpha.cce/preInstall String 参数解释: 安装前执行脚本。 输入的值需要经过Base64编码,方法如下: echo -n "待编码内容" | base64 约束限制: 安装前/后执行脚本统一计算字符,转码后的字符总数不能超过10240。 取值范围: 不涉及 默认取值:
alpha.cce/preInstall String 参数解释: 安装前执行脚本。 输入的值需要经过Base64编码,方法如下: echo -n "待编码内容" | base64 约束限制: 安装前/后执行脚本统一计算字符,转码后的字符总数不能超过10240。 取值范围: 不涉及 默认取值:
服务发布到ELB,ELB的后端为何会被自动删除? 问题描述: 服务发布到ELB,工作负载已正常,但服务的pod端口未及时发布出来,ELB里的后端会被自动删除。 问题解答: 创建ELB时候,如果ELB健康检查失败,后端服务器组会删除,而且后续服务正常以后也不会添加。如果是更新已有的SVC时则不会删除。
Volume 容器中的文件在磁盘上是临时存放的,当容器重建时,容器中的文件将会丢失,另外当在一个Pod中同时运行多个容器时,常常需要在这些容器之间共享文件,这也是容器不好解决的问题。 Kubernetes抽象出了Volume来解决这两个问题,也就是存储卷,Kubernetes的V
CoreDNS内存使用率超过百分之八十 描述(可选) 添加告警规则描述。 检查CoreDNS容器内存使用率是否大于80%。 告警规则(PromQL) 输入普罗查询语句。关于如何编写普罗查询语句,请参见查询示例。 本例中设置CoreDNS当内存使用率的最大值大于80%产生告警,示例如下: (sum(container_
test-rewrite-url cce * 121.**.**.** 80 10s 使用curl测试重写的能力,其中${ELB_IP}为Ingress访问的IP。 # curl -H "Host:example.com" ${ELB_IP}/first/aaa/bbb/end
alpha.cce/preInstall String 参数解释: 安装前执行脚本。 输入的值需要经过Base64编码,方法如下: echo -n "待编码内容" | base64 约束限制: 安装前/后执行脚本统一计算字符,转码后的字符总数不能超过10240。 取值范围: 不涉及 默认取值:
alpha.cce/preInstall String 参数解释: 安装前执行脚本。 输入的值需要经过Base64编码,方法如下: echo -n "待编码内容" | base64 约束限制: 安装前/后执行脚本统一计算字符,转码后的字符总数不能超过10240。 取值范围: 不涉及 默认取值:
PV、PVC和StorageClass 上一章节介绍的HostPath是一种持久化存储,但是HostPath的内容是存储在节点上,导致只适合读取。 如果要求Pod重新调度后仍然能使用之前读写过的数据,就只能使用网络存储了,网络存储种类非常多且有不同的使用方法,通常一个云服务提供商
HistoryServer-1-spark-sh1.out 启动后可以通过节点端口18080访问。 如需关闭history server,可执行以下脚本: stop-history-server.sh 父主题: 在CCE集群中部署使用Spark
test-redirect-url cce example.com 121.**.**.** 80 10s 使用curl测试重定向后的能力,其中${ELB_IP}为Ingress访问的IP。 curl -I -H "Host:example.com" ${ELB_IP}
集群视角的成本可视化最佳实践 应用现状 当前使用CCE时,默认是以CCE整个云服务的粒度体现计费信息,没有划分不同集群使用的成本。 解决方案 通过给集群使用的资源打上CCE-Cluster-ID标签,在成本中心通过标签过滤汇聚整个集群所使用资源的成本,以集群为单位进行成本分析,降本增效。
包年/包月节点修改自动续费配置 购买包年/包月计费模式的节点后,您可以根据需求为您的节点开通自动续费,或者修改已有的自动续费配置。 开通自动续费配置 登录CCE控制台,单击集群名称进入集群。 单击左侧导航栏的“节点管理”,并切换至“节点”页签。 单击包年/包月节点操作栏中的“更多
bytes,且一个Prometheus server可以处理数百万的metrics。 使用pull模式采集时间序列数据,这样不仅有利于本机测试而且可以避免有问题的服务器推送坏的metrics。 可以采用push gateway的方式把时间序列数据推送至Prometheus server端。
GPU虚拟化节点弹性伸缩配置 当集群中GPU虚拟化资源不足时,支持自动进行GPU节点的弹性伸缩。本文将指导您如何创建GPU虚拟化节点的弹性伸缩策略。 前提条件 已创建一个v1.28或v1.29版本的集群。 在集群中安装CCE AI套件(NVIDIA GPU)(2.7.5及以上版本
alpha.cce/preInstall 否 String 参数解释: 安装前执行脚本。 输入的值需要经过Base64编码,方法如下: echo -n "待编码内容" | base64 约束限制: 安装前/后执行脚本统一计算字符,转码后的字符总数不能超过10240。 取值范围: 不涉及 默认取值:
环境变量为应用提供极大的灵活性,您可以在应用程序中使用环境变量,在创建容器时为环境变量赋值,容器运行时读取环境变量的值,从而做到灵活的配置,而不是每次都重新编写应用程序制作镜像。 环境变量的使用方法如下所示,配置spec.containers.env字段即可。 apiVersion: v1 kind:
兼容Kubernetes默认GPU调度模式 开启GPU虚拟化后,工作负载调度GPU时建议使用显存隔离模式(即设置volcano.sh/gpu-mem.128Mi资源)和算显隔离模式(即同时设置volcano.sh/gpu-mem.128Mi和volcano.sh/gpu-core