检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
源进行训练和推理提供有效保障。您可以通过命令方便地配置容器内的虚拟GPU设备。 图1 XGPU共享技术架构图 产品优势 节约成本 随着显卡技术的不断发展,单张GPU卡的算力越来越强,同时价格也越来越高。但在很多的业务场景下,一个AI应用并不需要一整张的GPU卡。XGPU的出现让多
高优先级的任务被唤醒时获得一定的时间片加速,可立刻抢占低优先级的任务(忽略CFS的最小运行时间片),获得更好的低时延响应。 表1 cpu.qos_level接口说明 接口 说明 cpu.qos_level 配置cgroup的cpu优先级。取值类型为整数形式,取值范围 为[-2, 2
cgroup组内进程使用内存超过了设置的上限,cgroup通过KILL相应的进程来释放内存。 触发方法 执行占用大内存的程序,直到内存不足。 page allocation failure page allocation failure是申请空闲页失败时,系统上报的错误。当程序申请某个阶数(order)的内存,
内核memory的多级内存回收策略 需求背景 在容器高密度混合部署场景中,IO读写较多的离线业务消耗大量page cache,导致系统空闲内存降低,达到全局空闲内存水位线后触发全局内存回收,使得在线任务申请内存时进入内存回收的慢路径,引发时延抖动。 为解决此问题,HCE 2.0新
enable取值须为1或2。 新创建的cgroup组的memory.qos_level值默认会继承父节点的memory.qos_level的值,但是子节点的优先级不受父节点的限制。 如果修改cgroup组父节点的优先级,子节点的优先级会自动调整,和父节点保持一致。 整数形式,取值
镜像类型:系统盘镜像,请保持此默认配置。 镜像源:迁移系统的弹性云服务器,请保持此默认配置。 名称:填写便于识别的镜像名称。 协议:阅读并勾选协议。 单击“立即创建”创建私有镜像。 确认镜像信息,单击“提交”。 返回弹性云服务器控制台,在待切换操作系统的弹性云服务器的“操作”列下,选择“更多 > 镜像 >
类型。其中算力显存隔离的容器其隔离效果同固定算力(policy=1)完全一致,单显存隔离的容器共享算力显存隔离的容器分配后剩余的GPU算力。以max_inst=20为例,容器1、2为算力显存隔离容器,其分配的算力分别为5%、10%,容器3、4为单显存隔离的容器,则容器1、2分别占
字符类型的网卡不被识别。 实际使用过程中,带宽限速有可能造成协议栈内存积压,此时依赖传输层协议自行反压,对于udp等无反压机制的协议场景,可能出现丢包、ENOBUFS、限流不准等问题。 收包方向的网络限速依赖于TCP的反压能力,在非TCP协议的场景中,网络包已经收至目标网卡,不支持对于收包方向的网络限速。
一个的目录,并使用数字作为目录名称,例如0、1、2。本示例中只有一张显卡,对应的目录ID为0。 container 读写 XGPU服务会针对运行在GPU实例中的每个容器生成一个的目录。 version 只读 XGPU的版本。 uvm_disable 读写 是否禁用UVM的方式申请显存,全局粒度,默认值为0。
panic或者OOM killer。 OOM killer是linux内核的一个机制,该机制会监控那些占用内存过大的进程,尤其是短时间内消耗大量内存的进程,在系统的内存即将不够用时结束这些进程从而保障系统的整体可用性。 OOM相关参数 表1 OOM相关参数 参数名称 参数说明 取值
简介 Kafka是一个拥有高吞吐、可持久化、可水平扩展,支持流式数据处理等多种特性的分布式消息流处理中间件,采用分布式消息发布与订阅机制,在日志收集、流式数据传输、在线/离线系统分析、实时监控等领域有广泛的应用。 本教程介绍如何在HCE 2.0上安装部署Kafka。 准备工作 准备一
Summary: available 12 Security notice(s) 4 Critical Security notice(s) 6 Important Security notice(s) 2 Moderate Security notice(s) <command>的主要参数。
lnmp软件是一个用Linux Shell编写的可以为各类linux服务器或独立主机安装LNMP(Nginx/MySQL/PHP)、LNMPA(Nginx/MySQL/PHP/Apache)、LAMP(Apache/MySQL/PHP)生产环境的Shell程序。 本教程介绍如何在HCE
/etc/osmt/osmt.conf配置文件说明 本节对OSMT工具的配置文件osmt.conf不建议修改的配置项进行说明。 [auto] # if auto_upgrade is True, the osmt-agent will auto upgrade rpms use osmt
updates needed, but 2 updates available 升级待更新的RPM包。 执行dnf update命令升级所有待更新的RPM包,包括安全更新涉及的RPM包和漏洞修复。执行命令输出信息中会显示组件的目标版本信息(Version列)。 [root@localhost
冲突包列表 冲突包列表表示在原系统中存在与HCE系统冲突的软件包,会影响升级过程。 冲突包会在升级过程中自动卸载并且不会再安装上,升级前请评估原系统依赖的软件包是否在此冲突列表内,以免造成升级完成后软件缺失。 如果发现升级后软件包丢失,可以通过yum命令安装新版本软件包。 如果升
a)应对登录的用户进行身份标识和鉴别,身份标识具有唯一性,身份鉴别信息具有复杂度要求并定期更换。 确保root是唯一的UID为0的账户。 确保UID具有唯一的。 确保GID是唯一的。 确保账号名是唯一的。 确保组名是唯一的。 确保设置密码满足复杂度要求。 确保限制重用历史密码的次数。
run为默认的需要备份的目录,且不可以删减。这些目录会在执行版本升级功能的时候自动进行备份。 recover_service:OSMT会检查升级前后此列表中服务的启用状态是否一致,如果服务的启用状态被修改,OSMT会尝试恢复此服务的状态。 说明: [backup]中的路径需要配置为绝对路径的形式。
了不安全的异步信号函数,导致未经身份验证的攻击者利用漏洞可以在受害者Linux系统上以root身份执行任意代码。该漏洞影响范围广,目前漏洞技术细节和PoC均已公开,建议用户及时修复。 HCE对应的SA参见:HCE2-SA-2024-0224。 影响和风险 未经身份验证的攻击者可以
命令运行完成后,会在当前目录生成对应的以.inst为后缀的插桩文件mysqld.inst。 运行插桩文件获取进程PID,本例为87042。 创建mysqld的应用加速动态配置文件。 每一个待优化的应用都要有一个对应的配置文件,应用加速工具根据此配置文件对应用进行动态加速。 执行如下命令复制一份默认的配置文件