检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
XGPU算力调度示例 当使用XGPU服务创建XGPU时,XGPU服务会按照最大容器数量(max_inst)为每张显卡设置时间片(X ms)用于为容器分配GPU算力,以单元1、单元2…单元N表示。本节max_inst以20为例,介绍使用不同调度策略时对算力的调度示例。 原生调度(policy=0)
将操作系统迁移至HCE 2.0 约束限制 迁移操作 冲突包列表 父主题: 系统迁移
将操作系统迁移至HCE 1.1 约束限制 迁移操作 父主题: 系统迁移
附录 OSMT命令帮助信息 /etc/osmt/osmt.conf配置文件说明 父主题: 更新HCE系统和RPM包
内核功能与接口 内核memory的OOM进程控制策略 内核memory的多级内存回收策略 内核cpu cgroup的多级混部调度 内核异常事件分析指南
对HCE进行安全更新 安全更新概述 关于通用漏洞披露(CVE) yum命令参数 查询安全更新 检查安全更新 安装安全更新
系统迁移 x2hce-ca应用兼容性评估 将操作系统迁移至HCE 2.0 将操作系统迁移至HCE 1.1
XGPU共享技术 XGPU共享技术概述 安装并使用XGPU XGPU算力调度示例
安全 Huawei Cloud EulerOS 2.0等保2.0三级版镜像概述 安全启动
概述 应用加速工具是华为云提供的一款对应用进行性能优化的工具。 应用加速工具优化应用程序有两种方式。 静态加速: 静态加速只需要在应用程序运行时采集所在CPU上的pmu监控信息,基于采集到的监控信息将应用程序做静态重新制作,生成新的高性能应用程序二进制。该过程不需要应用程序代码做
请及时升级。 HCE支持使用dnf/yum命令和OSMT工具两种升级方式。 Linux自身支持dnf/yum命令,可对RPM包进行升级和回退,升级操作简单。 OSMT是华为云提供的对HCE系统及RPM包升级和回退的工具,可自定义升级范围和定时检查、延迟重启。 两种升级方式区别如下。
4秒执行一次。同时调用过后会重置一个hrtimer定时器在2倍的watchdog_thresh时间后到期。watchdog_thresh是内核参数,对应默认超时时间为20秒。 在超时时间内,如果内核线程watchdog没被调度,hrtimer定时器到期,即触发内核打印类似如下的soft
path <prio> tbwmcli -p path 设置/查询cgroup的QoS优先级。 当前仅支持设置离线和在线两个QoS优先级。 0:设置cgroup为在线QoS优先级。 -1:设置cgroup为离线QoS优先级。 示例:设置test_online cgroup的优先级为0。
-b命令参数中开始时间和截止时间的最小时间间隔,单位是秒。默认值为3600秒。 auto_upgrade_window:配置后台osmt-agent服务自动升级的时间窗,格式为"HH:MM-HH:MM",表示升级的开始时间和截止时间。 如果截止时间小于开始时间,则表示本次升级时间段跨越自然
情况下,会在VNC上出现错误日志。 问题现象 配置了IPVS虚拟服务器,但未配置真实服务器时,当网络请求发往该虚拟服务器地址后,通过华为云VNC登录的控制台上可以看到类似如下的错误日志。 解决方法 安装ipvsadm。 执行ipvsadm -Ln,查询当前虚拟服务器的配置。找到报错的虚拟服务器对应的表项。
wal_sender_timeout = 60s #流复制主机发送数据的超时时间 最后执行以下命令重启服务。 systemctl restart postgresql 配置PostgreSQL从节点。 执行以下命令在从节点安装服务端、客户端和相关组件。 dnf install postgresql
应用场景 弹性云服务器实例下首选HCE,实现用户业务高性能。 适用于政企、金融、制造等传统用户上云,第三方云迁移到华为云等场景。用户购买弹性云服务器服务后,可部署自有应用。 HCE结合弹性云服务器做了应用优化。在HCE操作系统中部署数据库、大数据、HPC、虚拟化、容器等应用时,M
指定优化次数,达到该次数时动态加速工具会停止优化,当前仅支持1次。 period 指定优化周期,达到该时间周期时停止优化,单位为秒,取值范围为1~600。 condition 指定优化条件,达到该条件时停止优化,当前不支持。 父主题: 应用加速工具
触发系统panic或者OOM killer。 OOM killer是linux内核的一个机制,该机制会监控那些占用内存过大的进程,尤其是短时间内消耗大量内存的进程,在系统的内存即将不够用时结束这些进程从而保障系统的整体可用性。 OOM相关参数 表1 OOM相关参数 参数名称 参数说明
XGPU共享技术概述 XGPU共享技术是华为云基于内核虚拟GPU开发的共享技术。XGPU服务可以隔离GPU资源,实现多个容器共用一张显卡,从而实现业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。 XGPU共享技术架构 XGPU通过自研的内核驱动为容器提供虚拟的GPU设备