搜索_华为云

使用PrometheusRules配置普罗监控与告警规则 - 云容器引擎 CCE

info: "集群CPU实际使用率超过50%, 集群当前CPU使用率为{{ printf \"%.2f\" $value }}%" description: "集群CPU实际使用率超过50%, 集群当前CPU使用率为{{ printf \"%.2f\"

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
使用Prometheus监控控制节点组件指标 - 云容器引擎 CCE

组件指标，可通过以下指导进行配置。集群版本需要v1.19及以上。在集群中需安装自建的Prometheus，您可参考Prometheus使用Helm模板进行安装。安装自建Prometheus后，还需要使用prometheus-operator纳管该Prometheus实例，具体操作步骤请参见Prometheus

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
使用注解为Pod绑定安全组 - 云容器引擎 CCE

使用注解为Pod绑定安全组使用场景云原生网络2.0网络模式下，Pod使用的是VPC的弹性网卡/辅助弹性网卡，可以通过配置Pod的annotation为Pod配置安全组。支持两种方式的安全组配置： Pod的网卡使用annotation配置的安全组，对应annotation配置：yangtse

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 容器网络 > 云原生网络2.0模型
收集容器日志 - 云容器引擎 CCE

收集容器日志通过云原生日志采集插件采集容器日志通过ICAgent采集容器日志（不推荐）父主题：日志中心

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 日志中心
为什么CCE集群界面的节点磁盘监控看起来不准确？ - 云容器引擎 CCE

面看到的磁盘使用率在40%不到。后面在该节点上排查，发现有一个pvc磁盘使用达到了92%，将这个盘清理后，集群界面的磁盘使用率和云监控使用率一致了。请问集群界面的节点监控是怎么样的原理，是否只报最大磁盘使用率的数据呢？问题解答： CCE集群监控信息中，磁盘使用率为当前节点中使用率最高的硬盘的监控信息。

帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群运行
根据GPU/NPU卡信息定位使用该卡的Pod - 云容器引擎 CCE

根据GPU/NPU卡信息定位使用该卡的Pod 在CCE中使用GPU/NPU卡时，无法直接获取到使用该卡的Pod。您可以根据GPU/NPU卡的信息，通过kubectl命令行操作筛选Pod，以便在GPU/NPU卡故障时能够及时将Pod驱逐。前提条件已创建CCE集群，且配置了kub

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
通过静态存储卷使用已有极速文件存储 - 云容器引擎 CCE

工作负载创建成功后，容器挂载目录下的数据将会持久化保持，您可以参考验证数据持久化及共享性中的步骤进行验证。通过kubectl命令行使用已有极速文件存储您可以根据不同的使用场景选择不同的创建方式。使用已有极速文件存储使用已有极速文件存储的子目录使用kubectl连接集群。创建PV。创建pv-sfsturbo

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 极速文件存储（SFS Turbo）
使用云原生监控插件监控自定义指标 - 云容器引擎 CCE

使用云原生监控插件监控自定义指标 CCE提供了云原生监控插件，支持使用Prometheus监控自定义指标。本文将通过一个Nginx应用的示例演示如何使用Prometheus监控自定义指标，步骤如下：安装并访问云原生监控插件 CCE提供了集成Prometheus功能的插件，支持一键安装。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
如何配置Pod使用GPU节点的加速能力？ - 云容器引擎 CCE

如何配置Pod使用GPU节点的加速能力？问题描述我已经购买了GPU节点，但运行速度还是很慢，请问如何配置Pod使用GPU节点的加速能力。解答方案1：建议您将集群中GPU节点的不可调度的污点去掉，以便GPU插件驱动能够正常安装，同时您需要安装高版本的GPU驱动。如果您的

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
使用Nginx Ingress实现灰度发布和蓝绿发布 - 云容器引擎 CCE

使用Nginx Ingress实现灰度发布和蓝绿发布本文将介绍使用Nginx Ingress实现灰度发布和蓝绿发布的应用场景、用法详解及实践步骤。应用场景使用Nginx Ingress实现灰度发布适用场景主要取决于业务流量切分的策略，目前Nginx Ingress支持基于H

帮助中心 > 云容器引擎 CCE > 最佳实践 > 发布
使用节点DNS缓存NodeLocal DNSCache - 云容器引擎 CCE

使用节点DNS缓存NodeLocal DNSCache 应用现状当集群中的DNS请求量增加时，CoreDNS将会承受更大的压力，可能会导致如下影响：延迟增加：CoreDNS需要处理更多的请求，可能会导致DNS查询变慢，从而影响业务性能。资源占用率增加：为保证DNS性能，CoreDNS往往需要更高规格的配置。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络 > CoreDNS配置优化实践 > 客户端
使用hostAliases参数配置Pod的/etc/hosts文件 - 云容器引擎 CCE

使用hostAliases参数配置Pod的/etc/hosts文件使用场景 DNS配置或其他选项不合理时，可以向pod的“/etc/hosts”文件中添加条目，使用hostAliases在pod级别覆盖对主机名的解析。操作步骤使用kubectl连接集群。创建hostaliases-pod

帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器
为什么kubectl top命令查看节点内存使用超过100%？ - 云容器引擎 CCE

} } ] } 则使用kubectl top node查看节点内存使用率：节点内存使用率 = 节点已使用量 / 节点可分配 = 2413824Ki / 2213604Ki = 109% 实际节点内存使用率：实际节点内存利用率 = 节点已使用量 / 节点内存总量 = 2413824Ki

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
Helm v2与Helm v3的差异及适配方案 - 云容器引擎 CCE

移除tiller Helm v3 使用更加简单和灵活的架构，移除了 tiller，直接通过kubeconfig连接apiserver，简化安全模块，降低了用户的使用壁垒。改进了升级策略，采用三路策略合并补丁 Helm v2 使用双路策略合并补丁。在升级过程中，会对比最近一次发布的chart

帮助中心 > 云容器引擎 CCE > 用户指南 > 模板（Helm Chart）
使用CoreDNS实现自定义域名解析 - 云容器引擎 CCE

tc/hosts中添加解析记录。使用 CoreDNS Rewrite 插件指向域名到集群内服务：在集群内对域名进行CNAME解析，将一个域名指向另一个集群内域名，相当于给Kubernetes中的Service名称取了个别名，无需提前知道解析记录的IP地址。使用 CoreDNS

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > DNS
使用Jenkins和Gitlab实现多集群隔离的DevOps流程 - 云容器引擎 CCE

使用Jenkins和Gitlab实现多集群隔离的DevOps流程方案概述资源规划实施步骤父主题： DevOps

帮助中心 > 云容器引擎 CCE > 最佳实践 > DevOps
Tensorflow训练 - 云容器引擎 CCE
Tensorflow训练 - 云容器引擎 CCE

yaml 使用GPU训练 TFJob可在GPU场景下进行，该场景需要集群中包含GPU节点，并安装合适的驱动。在TFJob中指定GPU资源。创建tf-gpu.yaml文件，示例如下：该示例的主要功能是基于Tensorflow的分布式架构，利用卷积神经网络（CNN）中的ResN

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
预置条件 - 云容器引擎 CCE
预置条件 - 云容器引擎 CCE

0-classification.ipynb的过程。 OBS存储数据预置创建OBS桶，并确认以下文件夹已创建，文件已上传至指定位置（需要使用OBS Browser工具）。例如：桶内文件路径/文件名，文件下载地址可至github中指定项目的指定路径下查找，示例如1、2所示。 m

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Caffe
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

便地部署、使用和管理当前最流行的机器学习软件。目前Kubeflow 1.0版本已经发布，包含开发、构建、训练、部署四个环节，可全面支持企业用户的机器学习、深度学习完整使用过程。如下图所示：通过Kubeflow 1.0，用户可以使用Jupyter开发模型，然后使用fairin

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
通过AOM配置自定义告警 - 云容器引擎 CCE

AOM中设置告警规则，您可以及时了解集群中各种资源是否存在异常。告警配置流程在SMN创建主题。创建行动规则。添加告警规则。事件类告警：根据集群上报到AOM的事件配置告警。推荐配置的事件和配置方法请参见添加事件类告警。指标类告警：实时监控环境中主机、组件等资源使用情况，

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心

总条数： 1352

上一页
1
...
4
5
6
...
68
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

使用PrometheusRules配置普罗监控与告警规则 - 云容器引擎 CCE

使用Prometheus监控控制节点组件指标 - 云容器引擎 CCE

使用注解为Pod绑定安全组 - 云容器引擎 CCE

收集容器日志 - 云容器引擎 CCE

为什么CCE集群界面的节点磁盘监控看起来不准确？ - 云容器引擎 CCE

根据GPU/NPU卡信息定位使用该卡的Pod - 云容器引擎 CCE

通过静态存储卷使用已有极速文件存储 - 云容器引擎 CCE

使用云原生监控插件监控自定义指标 - 云容器引擎 CCE

如何配置Pod使用GPU节点的加速能力？ - 云容器引擎 CCE

使用Nginx Ingress实现灰度发布和蓝绿发布 - 云容器引擎 CCE

使用节点DNS缓存NodeLocal DNSCache - 云容器引擎 CCE

使用hostAliases参数配置Pod的/etc/hosts文件 - 云容器引擎 CCE

为什么kubectl top命令查看节点内存使用超过100%？ - 云容器引擎 CCE

Helm v2与Helm v3的差异及适配方案 - 云容器引擎 CCE

使用CoreDNS实现自定义域名解析 - 云容器引擎 CCE

使用Jenkins和Gitlab实现多集群隔离的DevOps流程 - 云容器引擎 CCE

Tensorflow训练 - 云容器引擎 CCE

预置条件 - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

通过AOM配置自定义告警 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线