检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建一个普通job,镜像输入第三方镜像bvlc/caffe:cpu,设置对应的容器规格。 启动命令添加python /home/caffeEx00.py。 挂载刚刚导入的OBS存储盘: 单击“创建”。等待job执行完成,进入OBS存储盘的outputimg下,可以看到推理使用的图片。 登录在集群中添加GPU节点添加的节点,执行docker
如果您需要通过命令行创建,需要使用kubectl连接到集群,详情请参见通过kubectl连接集群。 如需使用本地临时卷,您需要将一块节点数据盘导入本地临时卷存储池,详情请参见在存储池中导入临时卷。 约束与限制 本地临时卷仅在集群版本 >= v1.21.2-r0 时支持,且需要everest插件版本>=1.2
登录Grafana页面查看GPU信息 如您安装了Grafana,您可通过导入NVIDIA DCGM Exporter Dashboard来展示gpu的相关指标信息。 关于在Grafana导入Dashboard的方法,请参见Manage dashboards。 手动部署dcgm-exporter组件 本文
Turbo集群支持该配置。 是否启用容器网络全预热: 开启:开启容器网络全预热后,您的集群节点会预热申请节点规格上限的网卡数,如s7.large.2机型的节点辅助弹性网卡上限是16个,则系统会动态预热出16个辅助弹性网卡。 关闭:不启用容器网络全预热时,您可以自行定义预热参数。 表3 容器网卡动态预热参数
通过CPU、内存使用量占整体节点资源比例计算出来的成本,结合Pod关联PVC存储的成本。 计算过程中,Pod的使用量为当前采样时刻下申请量(Request)和实际使用量(Real Used)中的最大值。如下图: 图1 工作负载成本计算原理 如:采样点1,Request CPU >
本地持久卷(Local PV) 本地持久卷概述 在存储池中导入持久卷 通过动态存储卷使用本地持久卷 在有状态负载中动态挂载本地持久卷 父主题: 存储
临时存储卷(EmptyDir) 临时存储卷概述 在存储池中导入临时卷 使用本地临时卷 使用临时路径 父主题: 存储
、每周、每月或每年的具体时间点),对无状态工作负载的副本数进行弹性扩缩容。 基于容器资源(CPU、内存)历史使用情况,对工作负载的资源申请量进行扩缩容。 基于容器资源(CPU、内存)历史使用情况进行预测,提前对工作负载副本数进行弹性扩缩容。 主要功能 在Kubernetes社区H
分布式的场景,要求每个Pod都有自己单独的状态时,比如分布式数据库,每个Pod要求有单独的存储,这时Deployment无法满足业务需求。 分布式有状态应用的特点主要是应用中每个部分的角色不同(即分工不同),比如数据库有主备、Pod之间有依赖,在Kubernetes中部署有状态应用对Pod有如下要求:
A,而是期望将Header中包含foo=bar或者Cookie中包含foo=bar的用户请求转发到新版本Service A'中。待运行一段时间稳定后,再逐步全量上线新版本,平滑下线旧版本。示意图如下: 场景二:切分一定比例的流量到新版本 假设线上已运行了一套对外提供七层服务的Service B,此
另外检查只能限制在应用内部,不能检查依赖外部的部分,例如当前端web server不能连接数据库时,这个就不能看成web server不健康。 Liveness Probe必须轻量 Liveness Probe不能占用过多的资源,且不能占用过长的时间,否则所有资源都在做健康检
资源的备份文件,Velero支持使用OBS或者MinIO对象存储。对象存储需要准备足够的存储空间用于存放备份文件,请根据您的集群规模和数据量自行估算存储空间。建议您使用OBS进行备份存储,可直接参考安装Velero进行Velero的部署。 前提条件 原始自建集群Kubernetes版本需1
手动解压节点上的cce-pause镜像安装包。 tar -xzvf /opt/cloud/cce/package/node-package/pause-*.tgz 导入镜像。 Docker节点: docker load -i ./pause/package/image/cce-pause-*.tar Containerd节点:
8 × 容量) 云硬盘吞吐量性能计算公式(MiB/s) 吞吐量≤min(4000,预配置IOPS/16) 吞吐量值由用户配置,范围为125~1000,具体可配置值≤(IOPS/4) 吞吐量 = min (1000, 120 + 0.5 × 容量) 吞吐量 = min (250, 100
您可以设置系统盘的规格为40GiB-1024GiB之间的数值,缺省值为50GiB。 说明: 通用型SSD V2支持自定义设置IOPS和吞吐量,极速型SSD V2支持自定义设置IOPS,设置范围参见云硬盘性能数据表。仅v1.21.15-r0、v1.23.14-r0、v1.25.9-r0、v1
告警中心基于AOM告警功能,提供集群内置告警一键开启能力,在集群发生故障时能够及时发现并预警,协助您维护业务稳定性。智能告警中心可有效节省您在AOM侧手动配置告警规则的工作量,并且内置的告警规则基于华为云容器团队大规模集群运维经验,能够满足您的日常运维所需,覆盖容器服务异常事件告警、集群相关基础资源的关键指标告警及集群中应用的指标告警。
使用配置项功能可以帮您管理不同环境、不同业务的配置。 方便您部署相同工作负载的不同环境,配置文件支持多版本,方便您进行更新和回滚工作负载。 方便您快速将您的配置以文件的形式导入到容器中。 约束与限制 ConfigMap资源文件大小不得超过1MB。 静态Pod中不可使用ConfigMap。 操作步骤 登录CCE控制台,单击集群名称进入集群。
备工作。 注册华为账号并实名认证 为账户充值 创建IAM用户 获取资源权限 (可选)创建虚拟私有云 (可选)创建密钥对 注册华为账号并实名认证 如果您已有一个华为账号,请跳到下一个任务。如果您还没有华为账号,请参考以下步骤创建。 打开华为云官网,单击页面右上角的“注册”。 根据提
载的个性化配置也会在插件升级时最大程度的得到保留。 指标采集管理 您可按需选择每一个系统预置采集任务的指标采集行为进行管理: 若您选择采集全量指标,则会采集该采集任务的所有指标。 若您选择指标采集白名单,则可以按需编辑白名单(基础免费指标无需添加),更加精确的控制自定义采集内容,降低您集群的资源消耗及指标上报成本。
CPU 申请量 * 100% CPU平均使用量 所选时间周期内,命名空间的 CPU 平均使用量 CPU申请量 所选时间周期最近账单日期,命名空间下工作负载的CPU申请量的累加 内存平均利用率 所选时间周期内,命名空间的内存平均利用率。内存利用率 = 内存使用量 / 内存申请量 * 100%