检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
监控GPU资源 本章介绍如何在UCS控制台界面查看GPU资源的全局监控指标。 前提条件 完成GPU资源准备。 当前本地集群已创建GPU资源。 当前本地集群开启了监控能力。 GPU监控 登录UCS控制台,在左侧导航栏选择“容器智能分析”。 选择对应的集群并开启监控,详细操作请参照集群开启监控。
量分发。 运维团队:查看并监控资源使用情况 运维人员利用容器智能分析提供的智能分析、仪表盘、通知配置、7x24小时守护功能,实时监控工作负载资源,分析应用健康状态,以及完成其他日常运维工作。详细的操作指导请参见容器智能分析。 访客:查看资源 访客(仅具有查看资源权限的人员)可执行集群、舰队、工作负载等资源的查看操作。
件以及打通与集群的网络连接,因此需要在集群中配置网络代理来接入网络并完成集群安装。 请在添加集群后的24小时内接入网络,您可单击右上角按钮查看详细的网络接入流程。如您未在24小时内接入网络,将会导致集群接入失败,可单击右上角按钮重新接入集群。如果已经接入但状态未更新,请等待2分钟后刷新集群。
单击流水线阶段中的“发布”,并单击“任务结果”查看发布单。 图2 查看发布单 发布单展示本次发布的基本信息,包括:工单名称、工单号、发布任务阶段展示。 工单详情页面展示发布过程的详细信息,可以查看当前容器舰队下对应的各集群指定工作负载的运行情况,并且用户可以进行重试、取消等操作。 单击“查看详情”可跳转至工单详情页。
合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书 另外,华为云还提供了以下销售许可证及软件著作权证书,供用户下载和参考。具体请查看合规资质证书。 图3 销售许可证&软件著作权证书 父主题: 安全
~10%]范围内连接呈黄色;当错误率大于10%连接呈红色。 单击拓扑中的服务节点,可以查看当前服务在所选时间内的指标数据;单击拓扑中某条连接,可以查看当前连接在所选时间内的指标数据。 自定义查询时间范围不能大于7天。 父主题: 监控中心
容器舰队 舰队开通联邦校验失败怎么办? 将已接入联邦且状态异常的集群移出舰队失败怎么办? 部署Nginx Ingress后状态为未就绪怎么办? 执行kubectl命令报错Error from server (Forbidden)怎么办?
集群联邦 集群联邦升级前检查不通过怎么办? 集群加入联邦失败怎么办? 集群加入联邦时,状态校验失败如何排查? 联邦管理面创建HPA后分发到成员集群失败怎么办? 创建MCI对象失败怎么办? 通过MCI访问服务失败,如何排查? 创建MCS对象失败怎么办? MCS/MCI实例删除异常如何排查?
本地集群 本地集群接入失败怎么办? 如何手动清理本地集群节点? 如何进行Cgroup降级? 虚拟机SSH连接超时怎么办? 本地集群如何扩容容器智能分析插件的存储磁盘? Master节点关机后集群控制台不可用怎么办? 节点扩容规格后未就绪怎么办? 如何更新本地集群ca/tls证书?
集群挂载存储卷声明时,需要集群提供商具备存储类(StorageClass)功能,以实现存储卷的动态创建。您可前往集群控制台的“存储”页面,在“存储类”页签下查看集群支持的存储类。更多StorageClass相关内容,请参见存储类。 创建存储卷声明 登录集群控制台。 在左侧导航栏中选择“存储”,在“
策略中心 启用策略中心失败怎么办? 策略中心运行异常怎么办? 如何清理策略中心相关资源?
附着集群 附着集群接入失败怎么办? 私网接入的集群误删除VPCEP后如何恢复? proxy-agent部署失败怎么办?
权限相关 如何配置UCS控制台各功能的访问权限? IAM用户登录UCS无法获取集群或舰队怎么办? 误删除或修改ucs_admin_trust委托后如何恢复? 舰队或集群关联权限异常怎么办? 集群注销后如何清理权限相关资源? 如何精细化管理集群联邦权限?
容器智能分析 集群因插件资源残留开启监控失败怎么办? 集群因策略拦截开启监控失败怎么办? 如何修改kube-state-metrics组件的采集配置?
kubeconfig -c test-redhat86 -o kubeconfig 可以使用ucs-ctl get kubeconfig -h查看获取KubeConfig所使用到的参数。 -c, --cluster:指定待导出KubeConfig的集群名。 -e, --eip:指定API
创建与删除节点(仅多云集群) 查看集群中节点 集群添加到UCS后,可在集群控制台查看集群中节点信息。 登录集群控制台,单击目标集群名称进入集群详情页。 在左侧导航栏中单击“节点管理”,查看集群中的节点信息。 单击操作列的“查看实例列表”,可查看运行在当前节点上的所有实例。 单击操作列的“事件”,可查看节点事件。
网格须开通AOM服务,否则无法查看服务健康。 操作步骤 登录UCS控制台,在左侧导航栏中单击“服务网格”。 单击服务网格名称,进入详情页。 在左侧导航栏,单击“服务中心”下的“网格服务”,进入网格服务列表页。 单击待查看的服务名,进入服务详情页,选择“服务健康”页签。 查看到服务健康下三个页
华为云集群 华为云集群状态不可用,报cce cluster not found怎么办?
已购买公网域名,并添加至华为云云解析(DNS)服务,具体操作请参考快速添加网站域名解析。 基础环境搭建 将集群注册到UCS并接入网络。具体操作请参见注册集群。 例如,将集群“ccecluster01”、“ccecluster02”注册到UCS的“ucs-group”容器舰队,并查看集群是否处于正常运行状态。 为集群所
服务运维系统插件由云原生服务中心提供,当部署的服务声明了诸如日志、监控运维能力配置时,集群中如果没有对应的运维能力插件,将会自动安装,您可通过“服务插件”页面查看各个集群中部署的运维能力插件。 背景知识 服务运维系统插件分别用于提供服务日志和监控能力。 ops-operator插件用于提供日志功能,