检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
HCE的REPO源配置与软件安装 HCE采用RPM包形式管理软件,并且提供了与系统配套的官方REPO源来发布软件包及其更新。您可通过dnf/yum命令实现常见的软件管理功能,包括安装、升级、卸载等。 官方repo源配置 通过弹性云服务器购买的HCE默认镜像,在/etc/yum.repos
准备工作 RPM包的更新方法有两种:使用osmt update命令更新和使用后台osmt-agent服务自动更新。此两种方法,都须先执行本节操作。 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base]
配置文件 本节提供了静态加速配置文件和动态加速配置文件中每个配置项的说明。 静态加速配置文件 应用加速工具默认静态加速配置信息如下,您可以自定义配置文件来优化应用。 表1 配置信息说明 模块名 描述 binary 定义二进制文件的相关属性。binary参数详情参见表2。 parameter
此XGPU分配的算力百分比。 如50,指此XGPU分配了显卡50%的算力。 了解procfs节点的用途后,您可以在GPU实例中执行命令进行切换调度策略、查看权重等操作,示例命令如下表所示。 命令 效果 echo 1 > /proc/xgpu/0/policy 修改第一张显卡的调度策略为权重调度。
内核memory的OOM进程控制策略 背景信息 现有操作系统中,支持配置离线业务和在线业务。当内存发生OOM时,会优先选择离线业务控制组中的消耗内存最多的进程,结束进程回收内存,但是对于某些离线业务也有核心业务,因此会造成很大的影响。 针对这个问题,HCE调整了OOM时回收内存的
OOM相关参数配置与原因排查 OOM相关概念 OOM(Out Of Memory,简称OOM)指系统内存已用完,在linux系统中,如果内存用完会导致系统无法正常工作,触发系统panic或者OOM killer。 OOM killer是linux内核的一个机制,该机制会监控那些占