检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
内核memory的OOM进程控制策略 背景信息 现有操作系统中,支持配置离线业务和在线业务。当内存发生OOM时,会优先选择离线业务控制组中的消耗内存最多的进程,结束进程回收内存,但是对于某些离线业务也有核心业务,因此会造成很大的影响。
在调度高优先级任务时: 在线任务可无条件抢占离线任务,在多核调度时,在线任务可优先抢占其他核上的离线任务。超线程(Hyper Thread)场景,优先级为2的在线任务可驱逐SMT上的离线任务。
内核memory的多级内存回收策略 需求背景 在容器高密度混合部署场景中,IO读写较多的离线业务消耗大量page cache,导致系统空闲内存降低,达到全局空闲内存水位线后触发全局内存回收,使得在线任务申请内存时进入内存回收的慢路径,引发时延抖动。
安装Kafka 简介 Kafka是一个拥有高吞吐、可持久化、可水平扩展,支持流式数据处理等多种特性的分布式消息流处理中间件,采用分布式消息发布与订阅机制,在日志收集、流式数据传输、在线/离线系统分析、实时监控等领域有广泛的应用。
当前仅支持设置离线和在线两个QoS优先级。 0:设置cgroup为在线QoS优先级。 -1:设置cgroup为离线QoS优先级。 示例:设置test_online cgroup的优先级为0。
utilization_line 读写 在离线混部的算力压制水位线。 当GPU整卡利用率超过该值时,在线容器完全压制离线容器,否则在线容器部分压制离线容器。 utilization_rate 只读 GPU整卡利用率。 xgpuIndex 读写 属于此显卡的xgpu子目录。
用户当前在线、离线业务分离部署,导致资源闲置现象严重,整体资源利用率偏低,亟需降本增效。 HCE结合云容器引擎做了CPU利用率优化。HCE采用混部引擎技术和隔离技术可使云容器引擎的CPU利用率达到40%-60%,并且QoS<1%,应用不卡顿,体验更流畅。