检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品功能 选择Linux kernel 5.10作为HCE的内核,为云上应用程序环境提供企业级高可靠性保障,并同步更新Linux社区的最新功能。 支持云原生调度增强、内存分级扩展,支持操作系统迁移、兼容性评估。 支持SM2等国密算法,等保2.0/CC EAL4+安全能力。 提供gcc
XGPU共享技术架构 XGPU通过自研的内核驱动为容器提供虚拟的GPU设备,在保证性能的前提下隔离显存和算力,为充分利用GPU硬件资源进行训练和推理提供有效保障。您可以通过命令方便地配置容器内的虚拟GPU设备。 图1 XGPU共享技术架构图 产品优势 节约成本 随着显卡技术的不断
时会触发Bad mm_struct。 I/O error Linux I/O error报错通常表示输入/输出操作失败,在网卡、磁盘等IO设备驱动异常,或文件系统异常都可能打印这个错误。 原理 错误原因取决于代码执行失败的条件。常见的触发异常的原因是硬件故障、磁盘损坏、文件系统错
内核功能与接口 内核memory的OOM进程控制策略 内核memory的多级内存回收策略 内核cpu cgroup的多级混部调度 内核异常事件分析指南
抢占调度表示每个容器固定获得1个时间片,XGPU服务会从算力单元1开始调度。但如果某个算力单元没有分配给某个容器,或者容器内没有进程打开GPU设备,则跳过调度切换到下一个时间片。图中灰色部分的算力单元表示被跳过不参与调度。 本例中容器1、2、3占用的实际算力百分比均为33.33%。 权重抢占调度(policy=4)
如何开启HCE操作系统的SELinux功能? HCE操作系统默认关闭SELinux功能。如果业务需要开启SELinux 功能,请参照本节指导操作。 请按照本节指导开启SELinux功能,勿直接通过/etc/selinux/config开启SELinux功能,否则可能会出现无法登录的问题。
内核memory的多级内存回收策略 需求背景 在容器高密度混合部署场景中,IO读写较多的离线业务消耗大量page cache,导致系统空闲内存降低,达到全局空闲内存水位线后触发全局内存回收,使得在线任务申请内存时进入内存回收的慢路径,引发时延抖动。 为解决此问题,HCE 2.0新
内核cpu cgroup的多级混部调度 需求背景 在业务混部场景中,Linux内核调度器需要为高优先级任务赋予更多的调度机会,并需要把低优先级任务对内核调度带来的影响降到最低。原有的在线、离线两级混部调度无法满足业务需求。 为解决此问题,HCE 2.0内核cpu cgroup支持
内核memory的OOM进程控制策略 背景信息 现有操作系统中,支持配置离线业务和在线业务。当内存发生OOM时,会优先选择离线业务控制组中的消耗内存最多的进程,结束进程回收内存,但是对于某些离线业务也有核心业务,因此会造成很大的影响。 针对这个问题,HCE调整了OOM时回收内存的
络QoS功能。 不支持cgroup v2。 升级oncn-tbwm软件包不会影响升级前的使能状态。卸载oncn-tbwm软件包会关闭对所有设备的使能。 仅支持识别数字、英文字母、中划线“-” 和下划线“_”四类字符类型的网卡名,其他字符类型的网卡不被识别。 实际使用过程中,带宽限
应当对系统关键目录进行分区挂载 - - - 否 确保禁用不需要的文件系统 - - - 否 确保无需修改的分区以只读方式挂载 - - - 否 确保无需挂载设备的分区以nodev方式挂载 - - - 否 确保无可执行文件的分区以noexec方式挂载 - - - 否 确保无需SUID和SGID的分区以nosuid方式挂载
应用场景 弹性云服务器实例下首选HCE,实现用户业务高性能。 适用于政企、金融、制造等传统用户上云,第三方云迁移到华为云等场景。用户购买弹性云服务器服务后,可部署自有应用。 HCE结合弹性云服务器做了应用优化。在HCE操作系统中部署数据库、大数据、HPC、虚拟化、容器等应用时,M
PostgreSQL部署 简介 PostgreSQL是一个开源的、高度稳定的数据库系统,为SQL的不同功能提供支持,如外键、子查询、触发器和不同的用户定义的类型和功能。它进一步增强了SQL语言,提供了一些细致地扩展数据工作负载的功能。它主要用于移动、网络、地理空间和分析应用程序领
ECS开启IPv6后,HCE系统内无法获取到IPv6地址 问题背景 在弹性云服务器ECS控制台上开启云服务器网卡的IPv6功能后,由于未在操作系统内部正确配置IPv6,导致HCE系统内无法获取到IPv6地址。 问题现象 在弹性云服务器ECS控制台上已开启IPv6功能,在详情界面已显示IPv6地址。
安装并使用XGPU 本章节介绍如何安装和使用XGPU服务。 约束限制 XGPU功能仅在Nvidia Tesla T4、V100上支持。 HCE内核版本为5.10及以上版本。 GPU实例已安装535.54.03版本的NVIDIA驱动。 GPU实例已安装18.09.0-300或更高版本的docker。
搭建SFTP 简介 SFTP(Secure File Transfer Protocol)是一种用于安全访问、传输和管理大文件和敏感数据的网络协议,它通过SSH协议运行,能够支持SSH完整的安全和身份验证功能。本教程介绍如何在HCE 2.0上部署SFTP服务。 准备工作 准备一台
Redis一主多从部署 简介 Redis(Remote Dictionary Server)是一个使用C语言编写的开源、基于内存、分布式、可选持久性的键值对存储数据库。Redis 是一个功能丰富的存储系统,适用于多种场景,包括缓存、会话存储、排行榜、实时分析等。它有广泛的应用,并
HCE的REPO源配置与软件安装 HCE采用RPM包形式管理软件,并且提供了与系统配套的官方REPO源来发布软件包及其更新。您可通过dnf/yum命令实现常见的软件管理功能,包括安装、升级、卸载等。 官方repo源配置 通过弹性云服务器购买的HCE默认镜像,在/etc/yum.repos
概述 OSMT是华为云提供的对HCE系统及RPM包升级和回退的工具。OSMT可自定义配置RPM包的升级范围,并支持周期性定时升级、在指定的时间段单次升级、延时升级并重启等功能。 版本升级和回退:介绍对整体HCE系统的升级及回退操作。 更新RPM包:介绍仅对RPM包的升级和回退操作。
lvm2-cluster fcoe-utils libblockdev udisks2 python-blivet device-mapper-multipath device-mapper-multipath-libs libblockdev-crypto libblockdev-fs