检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Nvidia驱动:您可使用CCE提供的驱动地址或手动填写自定义Nvidia驱动的地址,集群下全部GPU节点将使用相同的驱动。 GPU虚拟化功能仅支持470.57.02、510.47.03、535.54.03版本的GPU驱动。 建议您使用CCE提供的驱动地址,以满足驱动版本的要求。 如果下载链接为
插件中的node-exporter组件会监控Docker的存储磁盘空间,需要读取宿主机的/var/run/dockersock的获取Docker的info的数据。 node-exporter运行需要以下特权: cap_dac_override:读取Docker的info的数据。 升级插件
参照表1设置基本信息。 表1 基本信息说明 参数 参数说明 名称 新建的密钥的名称,同一个命名空间内命名必须唯一。 命名空间 新建密钥所在的命名空间,默认为当前查看的命名空间。 描述 新建密钥的描述。 密钥类型 新建的密钥类型。 Opaque:一般密钥类型。在高敏感场景下,建议先通过
查看舰队总览。您可以选择一个容器舰队或未加入舰队的集群,查看所选范围内已开启监控的集群、以及集群中的节点、负载总览信息。 本小节操作指导均以查看容器舰队的总览信息为例,若您需要查看未加入舰队集群的总览信息,请在容器洞察页面选择“其他 > 未加入舰队集群”,查看全部未加入舰队的集群、以及集群中的节点、负载总览信息。
帮助您安全地控制资源的访问。 通过IAM,您可以在账号中给员工创建IAM用户,并授权控制他们对资源的访问范围。例如您的员工中有负责软件开发的人员,您希望他们拥有UCS集群资源的使用权限,但是不希望他们拥有注销集群等高危操作的权限,那么您可以使用IAM为开发人员创建用户,通过授予仅
Service)是业界首个专门针对集群跨云场景的分布式云原生产品,为企业提供云原生业务部署、管理、应用生态的全域一致性体验,让客户在使用云原生应用时,感受不到地域、跨云、流量的限制,把云原生的能力带入到企业的每一个业务场景,加速千行百业拥抱云原生。 华为云UCS是一个分布式集群的统一管理平台,在CNCF
附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 公共请求消息头 名称 描述 是否必选 示例 Host 请求的服务器信息,从服务API的URL中获取。值为h
查找目标服务CockroachDB,并单击服务名称进入服务详情页,如图1所示。 图1 CockroachDB服务 单击“订阅”按钮,并确认订阅。 分发实例 登录UCS控制台,在左侧导航栏中选择“云原生服务中心”,单击“我的订阅”页签。 将鼠标移动至CockroachDB服务选项卡,并单击“创建实例”,如图2所示。
任务类型为“build构建”。该阶段的具体操作为基于应用源码构建部署应用的镜像,详细的操作细节见CodeArts流水线。 设置最右侧阶段的名称为“阶段_2”,任务类型为“云原生发布”。该阶段的具体操作为根据定义的交付资源yaml文件将应用部署至UCS所属舰队中。 图3 添加云原生发布任务
EIP的方式提供了服务的访问入口。 故障场景构造 构造单地域故障的场景,以Region1故障为例,执行以下操作,构造单地域故障: 休眠Region1的cce-cluster01集群,并关机集群下的节点。 解绑Region1的ELB实例的EIP1。 容灾能力验证 在DNS的域名解析
发布单展示本次发布的基本信息,包括:工单名称、工单号、发布任务阶段展示。 工单详情页面展示发布过程的详细信息,可以查看当前容器舰队下对应的各集群指定工作负载的运行情况,并且用户可以进行重试、取消等操作。 单击“查看详情”可跳转至工单详情页。 工单详情页可查看应用在舰队内每个集群的发布过程和
使用集群联邦实现应用多活容灾 应用场景 为了应对云单点宕机故障,UCS的集群联邦提供多云多活应用、秒级流量接管能力。业务应用的实例可以多云多活的部署在不同云上的容器服务中,当云单点宕机故障发生时,集群联邦可以秒级自动完成应用实例的弹性迁移以及流量的切换,业务的可靠性大大提升。 多活容灾方案示意如图1所示,
单击服务名称即可查看服务详情,包括基本信息以及各集群的部署信息。 在服务详情页的部署集群栏中单击“查看YAML”,可查看各个集群中部署的服务实例YAML,并支持下载。 编辑YAML 单击服务名称后的“编辑YAML”,可查看并编辑当前服务的YAML文件。 更新 单击服务名称后的“更新”。 根据服务参数更改信息。
单击路由名称后的“编辑YAML”,可查看并编辑当前路由的YAML文件。 更新 单击路由名称后的“更新”。 根据路由参数更改信息。 单击“确认”提交已修改的信息。 删除 单击路由名称后的“删除”,并单击“是”进行确认。 批量删除 勾选需要删除的路由。 单击左上角的“批量删除”。 单击“是”进行确认。 父主题: 服务与路由
图1 复制资源名称 登录UCS控制台,选择集群所在的区域,在筛选条件中选择“集群名称”,并输入图2中复制的资源ID即可查找到该集群所在舰队。 图2 查找集群 单击舰队名称,左侧导航栏选择“容器集群”,即可找到该集群。 单击该集群右上角的按钮,注销集群。 图3 注销集群 按需计费资源删
weight:资源分配最少的的节点优先,默认值是1 balancedresource.weight:node上面的不同资源分配平衡的优先,默认值是1 mostrequested.weight:资源分配最多的的节点优先,默认值是0 tainttoleration.weight:污点容忍高的优先调度,默认值是1
单击服务名称后的“编辑YAML”,可查看并编辑当前服务的YAML文件。 更新 单击服务名称后的“更新”。 根据服务参数更改信息。 单击“确认”提交已修改的信息。 删除 单击服务名称后的“删除”,并单击“是”进行确认。 批量删除 勾选需要删除的服务。 单击左上角的“批量删除”。 单击“是”进行确认。 父主题: 服务(Service)
检查异常项,请按控制台提示排查并修复。 升级 执行集群联邦升级。 失败后回退 升级若失败,可以选择重新升级或回退至原有联邦版本。 集群联邦升级路径 UCS在发布集群联邦的最新版本后,会对该版本所做的变更进行说明。如下表格详细介绍了联邦版本能够升级到的目标版本,以及版本差异。 表1
项”页签的服务开通自动续费。 图1 续费管理 为包年/包月云服务开通自动续费。 单个资源开通自动续费:选择需要开通自动续费的资源,单击操作列“更多”,并选择“开通自动续费”。 图2 单个资源开通自动续费 批量资源开通自动续费:选择需要开通自动续费的资源,单击列表左上角的“开通自动续费”。
本章介绍如何在UCS控制台界面查看GPU资源的全局监控指标。 前提条件 完成GPU资源准备。 当前本地集群已创建GPU资源。 当前本地集群开启了监控能力。 GPU监控 登录UCS控制台,在左侧导航栏选择“容器智能分析”。 选择对应的集群并开启监控,详细操作请参照集群开启监控。 单击集群名称,进入“容器洞察”总览页面。