检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
systemctl status nvidia-fabricmanager 相关链接 GPU插件及驱动相关问题的排查思路 工作负载异常:GPU相关 GPU调度 父主题: 插件管理
在左侧导航栏中单击“插件管理”,在已安装插件栏中单击E-Backup插件下的“编辑”按钮。 修改插件规格配置,相关参数说明请参见表1。 单击“确定”,插件状态为“升级中”。待升级完成后,修改后的插件配置将会生效。 父主题: 插件管理
StatefulSet:主要用于管理有状态的应用,创建的Pod拥有根据规范创建的持久型标识符。 DaemonSet:主要用于部署常驻集群内的后台程序,例如节点的日志采集。 Job:Job控制器会创建一个或者多个Pod,这些Pod按照运行规则运行,直至运行结束。
父主题: 节点管理
父主题: 插件管理
UCS服务资源包括容器舰队、集群、联邦实例等等,管理员可以针对用户的角色(如开发、运维)进行差异化授权,精细控制他们对UCS资源的使用范围。
在左侧导航栏中单击“节点管理”,进入节点管理界面。 选择多个需要删除的节点,单击“节点名称”上方“更多”,选择“删除”,即可批量删除节点。 如果需要删除单个节点,单击该节点后方的“更多”,选择“删除”。 单击“是”,即可删除节点。 父主题: 节点管理
父主题: 插件管理
联邦管理面创建HPA后分发到成员集群失败怎么办? 问题背景 在集群联邦管理面创建HPA后,创建PropagationPolicy将其分发到版本低于v1.23的成员集群失败。
可视化监控洞察,运维更简单 支持立体化监控运维,并且兼容开源Prometheus和OpenTelemetry生态,拥有灵活的Dashboard,支持智能巡检、容器洞察、服务网格洞察。
一个系统可以分为多个模块,每个模块由多个微服务组成,为保证后期运维的高效,可以将节点打上对应模块的标签,让各模块的工作负载部署到各自的节点上,互不干扰、利于维护。 节点固有标签 创建节点后,UCS会为节点添加固有标签,这些标签是无法编辑和删除的。节点固有标签的含义请参见表1。
图2 访问负载均衡IP 父主题: 管理本地集群网络
服务删除 删除服务后,目标集群中该服务相关的管理组件将会被清理,但不会删除集群中已部署的运维类服务。 服务删除仅会删除在目标集群中部署的服务管理类插件,并不会退订服务,如需退订服务请参见服务退订。 当服务当前存在实例时,将无法删除服务。
如果是已加入容器舰队的集群,先进入对应容器舰队控制台,选择左侧 “集群管理”内的“容器集群”,再进入对应集群控制台。 左侧导航栏内选择“工作负载”,单击镜像创建。
父主题: 单集群管理
父主题: 配置管理
父主题: 网格管理
父主题: 权限管理
父主题: 单集群管理
父主题: 管理本地集群