检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
每个组件对应Flink官网提供的不同资源定义文件,具体说明请参见表1。此外,还需要使用Flink官网的flink-configuration-configmap.yaml配置文件完成Flink集群的基本配置。 表1 Flink集群关键组件 关键组件 资源定义文件 说明 运行JobManager的Deployment
通用计算增强型 通用计算增强型弹性云服务器是CPU独享型实例,实例间无CPU资源争抢,性能强劲稳定,搭载全新网络加速引擎,提供更高的网络性能。 表1 通用计算增强型实例特点 规格名称 计算 网络 支持集群类型 通用计算增强型aC7 CPU/内存配比:1:2/1:4 vCPU数量范围:2-232
ble_auto_mount_secret)”为是。 单击“确定”。 获取访问密钥 登录控制台。 鼠标指向界面右上角的登录用户名,在下拉列表中单击“我的凭证”。 在左侧导航栏单击“访问密钥”。 单击“新增访问密钥”,进入“新增访问密钥”页面。 单击“确定”,下载访问密钥。 使用访问密钥创建Secret
和点,最长63个字符。 示例:"foo": "bar" 表5 ClusterConfigurationsSpec 参数 参数类型 描述 packages Array of packages objects 组件配置项列表 表6 packages 参数 参数类型 描述 name String
例如错误的端口、应用未实现健康检查协议等。 图4 GRPC检查 公共参数说明 表1 公共参数说明 参数 参数说明 检测周期(periodSeconds) 探针检测周期,单位为秒。 例如,设置为30,表示每30秒检测一次。 延迟时间(initialDelaySeconds) 延迟检
0%。 另外有两条注解annotations,一条是CPU的阈值范围,最低30,最高70,表示CPU使用率在30%到70%之间时,不会扩缩容,防止小幅度波动造成影响。另一条是扩缩容时间窗,表示策略成功触发后,在缩容/扩容冷却时间内,不会再次触发缩容/扩容,以防止短期波动造成影响。
ms/{name} 表1 路径参数 参数 是否必选 参数类型 描述 name 是 String 需要删除的PersistentVolumClaim的名称。 namespace 是 String 指定PersistentVolumeClaim所在的命名空间。 表2 Query参数 参数
DCGM_FI_DEV_DEC_UTIL Gauge % 解码器利用率 表2 内存指标 指标名称 指标类型 单位 说明 DCGM_FI_DEV_FB_FREE Gauge MB 表示帧缓存剩余数,帧缓存一般被称为显存 DCGM_FI_DEV_FB_USED Gauge MB 表示帧缓存已使用数,该值与nvidia-
取值范围为1%~99% kube-proxy组件配置 名称 参数 参数说明 取值 修改说明 系统中最大的连接跟踪表项数目 conntrack-min 系统中最大的连接跟踪表项数目。 可通过以下命令查询: sysctl net.nf_conntrack_max 默认:131072 -
PVC指定的PV类型 表6 ResourceRequirements 参数 是否必选 参数类型 描述 limits 否 Map<String,String> 资源限制,创建时指定无效 requests 否 Map<String,String> 资源需求,创建时指定无效 表7 Persis
5.0,则检查log-agent-otel-collector工作负载的标准输出。 可在插件中心单击 “云原生日志采集插件”名称,在“实例列表”中选择 log-agent-otel-collector 最右侧的日志查看。 图7 查看log-agent-otel-collector实例日志
前缀匹配:例如映射URL为/healthz,只要符合此前缀的URL均可访问。例如/healthz/v1,/healthz/v2。 精确匹配:表示只有URL完全匹配时,访问才能生效。例如映射URL为/healthz,则必须为此URL才能访问。 路径:需要注册的访问路径,例如:/healthz。
缩。 应用场景 当业务需要使用大规模集群时,推荐您使用节点池进行节点管理,以提高大规模集群易用性。 下表介绍了多种大规模集群管理场景,并分别展示节点池在每种场景下发挥的作用: 表1 节点池场景及作用 场景 作用 集群存在较多异构节点(机型配置不同) 通过节点池可规范节点分组管理。
地址列表。最多可以指定3个IP地址。当Pod dnsPolicy设置为“ None”时,列表必须至少包含一个IP地址,否则此属性是可选的。列出的服务器将合并到从指定的DNS策略生成的基本名称服务器,并删除重复的地址。 searches:Pod中主机名查找的DNS搜索域列表。此属性
/bin/ 安装Kubeflow 您可以参考以下步骤安装所有Kubeflow官方组件。成功安装所有内容后,您可以访问Kubeflow中央仪表板,详情请参见连接Kubeflow。 安装Kubeflow 1.7.0版本。 wget https://github.com/kubeflo
CCE AI套件(NVIDIA GPU)版本发布记录 表1 CCE AI套件(NVIDIA GPU)版本记录 插件版本 支持的集群版本 更新特性 2.7.42 v1.28 v1.29 v1.30 v1.31 新增NVIDIA 535.216.03驱动,支持XGPU特性 2.7.41
功能总览 功能总览 全部 集群管理 节点管理 节点池管理 工作负载管理 容器网络 容器存储 弹性伸缩 应用调度 容器运维 模板市场 插件管理 权限管理 集群管理 CCE是一种托管的Kubernetes产品/服务,可进一步简化基于容器的应用程序部署和管理,您可以在CCE中方便的创建
管理工作负载 操作场景 工作负载创建后,您可以对其执行升级、编辑YAML、日志、监控、回退、删除等操作。 表1 工作负载/任务管理 操作 描述 监控 可以通过CCE控制台查看工作负载和容器组的CPU和内存占用情况,以确定需要的资源规格。 日志 可查看工作负载的日志信息。 升级 可
500m limits: cpu: 500m schedulerName:设置为volcano,表示使用Volcano调度该工作负载。 scheduling.k8s.io/group-name:指定上一步中创建的PodGroup,示例为pg-test1。
详情请参见设置容忍策略。 单击“安装”。 组件说明 表2 插件组件 容器组件 说明 资源类型 customedhpa-controller CCE自研的弹性伸缩组件,可基于CPU利用率、内存利用率等指标,对无状态工作负载进行弹性扩缩容。 Deployment 版本记录 表3 CCE容器弹性引擎插件版本记录