检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
原生调度(policy=0) 原生调度表示使用NVIDIA GPU本身的算力调度方式。在原生调度策略下XGPU只用来做显存的隔离。 固定算力调度(policy=1) 固定算力调度表示以固定的算力百分比为容器分配算力。例如为容器1和容器2分别分配5%和15%的算力,如下图所示。 平均调度(policy=2)
同优先级的qos_level之间的资源竞争服从CFS调度器的策略。 同一个cpu上,qos_level < 0 的任务始终会被qos_level >= 0的任务无条件抢占,不受层级约束。 在调度高优先级任务时: 在线任务可无条件抢占离线任务,在多核调度时,在线任务可优先抢占其他核上的离线任务。超线程(Hyper
Redis一主多从部署 简介 Redis(Remote Dictionary Server)是一个使用C语言编写的开源、基于内存、分布式、可选持久性的键值对存储数据库。Redis 是一个功能丰富的存储系统,适用于多种场景,包括缓存、会话存储、排行榜、实时分析等。它有广泛的应用,并
的适配。 迁移能力评估 HCE已有成熟的搬迁指导,按照分布式集群应用、主备应用、单机应用三种类型对各种应用进行归类,并制定相应的搬迁方案: 针对分布式集群软件,如大数据、分布式存储。CentOS搬迁无需中断业务, 基于分布式软件伸缩扩容机制,HCE实现滚动代替,平滑搬迁。 针对主
节为您介绍这些内核事件的原理及触发方法。 soft lockup soft lockup是内核检测CPU在一定时间内(默认20秒)没有发生调度切换时,上报的异常。 原理 soft lockup利用Linux内核watchdog机制触发。内核会为每一个CPU启动一个优先级最高的FI
安装Kafka 简介 Kafka是一个拥有高吞吐、可持久化、可水平扩展,支持流式数据处理等多种特性的分布式消息流处理中间件,采用分布式消息发布与订阅机制,在日志收集、流式数据传输、在线/离线系统分析、实时监控等领域有广泛的应用。 本教程介绍如何在HCE 2.0上安装部署Kafka。
IPVS报错问题说明 问题背景 IPVS(IP Virtual Server)指IP虚拟服务器,用于负载均衡、网络转发等目的。用户在系统上配置了IPVS虚拟服务器,但未配置真实服务器的情况下,会在VNC上出现错误日志。 问题现象 配置了IPVS虚拟服务器,但未配置真实服务器时,当
产品优势 华为云服务垂直整合:联合华为云擎天平台垂直优化、GuestOS/HostOS协同,提升应用性能,打造弹性云服务器、云容器引擎、弹性负载均衡、数据库等服务优选竞争力。 云原生混部优选体验:支持容器应用混部,打造业界优选的云原生资源利用效率;提供占用资源少、启动速度快、资源利用率高的云原生基础设施。
如何设置自动注销时间TMOUT? 操作背景 为了保证系统的安全性,以及减少用户在不使用系统时所造成的资源浪费,在用户离开系统一段时间后,必须对连接进行注销。注销有诸多方法,修改TMOUT变量为其中的解决方案之一。 TMOUT是一个环境变量,它决定了在系统自动注销前所空闲的秒数。因
Pod带宽管理工具 在业务混合部署的场景下,Pod带宽管理功能根据QoS分级对资源进行合理调度,提升网络带宽利用率。HCE提供oncn-tbwm带宽管理工具,使用tbwmcli命令对收发包方向的网络限速功能,实现网络QoS。 前提条件 本功能固定使用ifb0,使用前请确定虚拟网卡ifb0未被使用,并加载ifb驱动。
Apache HTTP Server(简称Apache)是Apache软件基金会的一个开源网页服务器,可以在大多数操作系统中运行,由于其能跨平台、安全性高而被广泛使用,是最流行的Web服务器软件之一,其拥有的特性包括支持FastCGI、支持SSL、集成Perl处理模块等。本教程介绍如何在HCE
位线后触发全局内存回收,使得在线任务申请内存时进入内存回收的慢路径,引发时延抖动。 为解决此问题,HCE 2.0新增支持多级内存回收策略。申请内存时,设置内存警示值,可触发内存回收任务,保证可用内存空间;回收内存时,设置多级内存保护水位线,保护任务可用性。 约束与限制 memory
内核功能与接口 内核memory的OOM进程控制策略 内核memory的多级内存回收策略 内核cpu cgroup的多级混部调度 内核异常事件分析指南
参数 说明 -h, --help 提供osmt job命令的帮助信息。 -s, --show 显示后台任务信息。 -d DELAY, --delay DELAY 允许将当前等待重启的任务延迟一段时间,具体格式为“1:50:00”,表示将重启时间推迟1小时50分。 -c, --cancel
、C++、Java和Python语言的rpm格式文件。 x2hce-ca工具不支持回滚,任务异常中断后会在/opt/x2hce-ca/目录下产生残留文件,并不影响工具再次使用。异常中断的任务请重新执行。 安装和运行x2hce-ca工具的系统参数要求如下所述。 表1 运行x2hce-ca工具的操作系统参数要求
业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。 XGPU共享技术架构 XGPU通过自研的内核驱动为容器提供虚拟的GPU设备,在保证性能的前提下隔离显存和算力,为充分利用GPU硬件资源进行训练和推理提供有效保障。您可以通过命令方便地配置容器内的虚拟GPU设备。 图1 XGPU共享技术架构图
XGPU共享技术 XGPU共享技术概述 安装并使用XGPU XGPU算力调度示例
支持云原生调度增强、内存分级扩展,支持操作系统迁移、兼容性评估。 支持SM2等国密算法,等保2.0/CC EAL4+安全能力。 提供gcc 10.3、binutils 2.37、glibc 2.34编译器,增强稳定性并提高与其它软件的兼容性。 对Intel、AMD、Arm等平台进行功
指定GPU使用的算力隔离的策略。 0:不隔离算力,即原生调度。 1:固定算力调度。 2:平均调度。 3:抢占调度。 4:权重抢占调度。 5:混合调度。 6:权重弱调度。 算力隔离策略示例详见XGPU算力调度示例。 设置算力隔离策略为固定算力调度:GPU_POLICY=1 GPU_CONTAINER_PRIORITY
安全启动 安全启动 通过安全启动(SecureBoot)可以保证系统启动过程中各个部件的完整性,防止没有经过合法签名的部件被加载运行,从而防止对系统及用户数据产生安全威胁并防御bootkit和rootkit攻击。HCE 2.0支持安全启动。 查看是否开启SecureBoot HC