检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
请按表1识别产生按需计费的原因,并重新选择正确的资源包或保证账户中的余额充足。
可实现快速高效地处理推理和图像识别等工作。 NPU调度可以指定Pod申请NPU的数量,为工作负载提供NPU资源。 父主题: NPU调度
问题描述 kube-prometheus-stack插件的kube-state-metrics组件负责将Prometheus的metrics数据格式转换成K8s API接口能识别的格式。
配置条件触发自动切流 本小节指导您配置条件触发自动切流,以识别集群CoreDNS功能故障并自动摘除流量。
安装本插件后,可支持使用NPU的节点,实现快速高效地处理推理和图像识别等工作。 前置条件 安装huawei-npu的节点需要添加标签“accelerator/huawei-npu”,标签值可为空。 使用npu插件在Ascend Snt9设备上运行,需先安装volcano插件。
创建终端节点以私网接入本地集群 应用场景 用户在线下IDC有kubernetes集群,接入到UCS开启容器智能分析服务,能够与SWR、OBS通信,在无法通过公网连接的情况下,可以先通过VPN与华为云VPC连接,然后通过VPC终端节点服务,让VPC能够在内网访问UCS、SWR、DNS
图1 工作负载详情页 编辑YAML 可通过在线YAML编辑窗对无状态工作负载、有状态工作负载、守护进程集、定时任务和容器组的YAML文件进行修改和下载。普通任务的YAML文件仅支持查看、复制和下载。本文以无状态工作负载为例说明如何在线编辑YAML。
自动切流能力的应用场景主要有: 识别集群故障并自动切流:在集群内关键组件CoreDNS功能故障后,自动探查并及时上报至控制面,将该集群上的流量摘除,由此保障服务可用性不受单个集群组件故障影响。具体切流操作请参见配置条件触发自动切流。
挑战二:弹性能力不足,无法满足大量在线用户并发接入,网络时延较高。 挑战三:涉及业务种类繁多,集群部署分散,运维管理困难。 优势 UCS平台将边缘云、IDC、华为云资源有机整合,实现算力、流量、数据统一管理,加速汽车行业的数字化转型。
同一个服务有两个版本在线,将一部分流量切到某个版本上。 服务保护,如限制并发连接数、限制请求数、隔离有故障的服务实例等。 动态修改服务中的内容,或者模拟一个服务运行故障等。
流量策略概述 流量策略要解决的问题类似如下: 动态修改服务间访问的负载均衡策略,比如配置一致性哈希将流量转发到特定的服务实例上; 同一个服务有两个版本在线,将一部分流量切到某个版本上; 服务保护,如限制并发连接数、限制请求数、隔离有故障的服务实例等; 动态修改服务中的内容,或者模拟一个服务运行故障等
在线编辑或选择导入自定义资源的YAML文件,单击“确定”。 其他操作: 单击操作列“查看YAML”,可查看自定义资源的YAML内容。 单击操作列“查看资源”,可查看集群中已有的自定义资源实例。 父主题: 单集群管理
为了帮助您快速识别和修复问题,资源概况中提供了API Server的总QPS和请求错误率指标。 资源消耗Top统计 在资源消耗TOP统计中,UCS服务会将CPU使用率和内存使用率排名前五的节点、无状态负载、有状态负载和Pod纳入统计范围,以帮助您识别资源消耗“大户”。
如果您接入的集群中包含超大容量的节点,并且希望其不被统计在UCS控制台集群列表上的CPU和内存分配率指标中,那么需要为这个节点打上“type:virtual-kubelet”标签,以便您准确识别集群资源分配情况。为集群节点打标签请参照为节点添加标签/污点。 父主题: UCS集群
对用户部署在各集群的业务提供实时的状态观测和消息通知,以确保应用出现问题时可以快速识别和定位,保障使用客户业务App的终端用户的使用体验和服务级别目标(SLO)达成。
灰度发布,是版本升级平滑过渡的一种方式,其本质就是根据请求、比例或其他混合条件切分流量,其核心工作是实现多个版本同时在线,并通过一定的流量策略将部分流量切分到灰度版本上,当版本升级时,使部分用户使用新版本,其他用户继续使用老版本,待新版本稳定后,逐步扩大范围把所有用户流量都迁移到新版本上面来
若您的集群对接了对象存储,且需同步搬迁至云上,可以使用华为云对象存储迁移服务 OMS,帮助您将对象存储中的数据在线迁移至华为云对象存储服务 OBS。 若您的集群使用文件存储,迁移上云可以使用华为云弹性文件服务 SFS,具体请参见数据迁移。
OMS服务是一种线上数据迁移服务,帮助您将其他云服务商对象存储中的数据在线迁移至华为云的对象存储服务 OBS中。 若您的集群使用了文件存储,跨云迁移可以使用华为云弹性文件服务 SFS,具体请参见数据迁移。
请参考已购买资源包,为什么仍然产生按需计费识别产生按需计费的原因,并重新选择正确的资源包或保证账户中的余额充足。 未购买套餐包:按需计费模式下,UCS按每小时扣费,当余额不足,无法对上一个小时的费用进行扣费。
多场景:使用场景广泛,典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理。 负载伸缩实现机制 UCS的负载伸缩能力是由FederatedHPA和CronFederatedHPA两种负载伸缩策略所实现的,如图1所示。