检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
HCE支持使用dnf/yum命令和OSMT工具两种升级方式。 Linux自身支持dnf/yum命令,可对RPM包进行升级和回退,升级操作简单。 OSMT是华为云提供的对HCE系统及RPM包升级和回退的工具,可自定义升级范围和定时检查、延迟重启。 两种升级方式区别如下。 表1 升级方式区别 项目 使用dnf或yum命令升级
st以20为例,介绍使用不同调度策略时对算力的调度示例。 原生调度(policy=0) 原生调度表示使用NVIDIA GPU本身的算力调度方式。在原生调度策略下XGPU只用来做显存的隔离。 固定算力调度(policy=1) 固定算力调度表示以固定的算力百分比为容器分配算力。例如为
uwsgi_param UWSGI_CHDIR /iCourse; index index.html index.htm; client_max_body_size 35m; index index.html index.htm; } 最终效果如下。 在项目目录新建uwsgi_config
正确。 图2 已配置真实服务器 如上图是完整的有真实服务器的配置。 如果希望排除该IPVS错误日志在VNC上对用户操作的干扰,可以按如下的方式处理(选择其中一种即可) 关闭业务发送的网络请求,具体操作需要用户根据自身业务情况来处理。 执行以下命令调整内核printk打印等级。 echo
算力支持最小1%粒度的划分,推荐最小算力不低于4%。 兼容性好 不仅适配标准的Docker和Containerd工作方式,而且兼容Kubernetes工作方式。 操作简单 无需重编译AI应用,运行时无需替换CUDA库。 父主题: XGPU共享技术
remove将删除所有升级备份数据,执行后无法再执行回退。 版本回退 请根据是否需要立刻重启,选择合适的回退方式。 回退至原系统,不立刻重启。 osmt rollback 回退至原系统并立刻重启。使用此方式,请忽略步骤2。 osmt rollback --reboot_config always 执行reboot命令重启系统。
[mission]优化运行中的应用所要配置的参数。 log-type 运行时日志采集方式,当前仅支持instrument方式。 hotpatch-type 热补丁模式,当前仅支持mode1即ptrace方式。 snapshot-path 优化后的二进制快照文件存放的目录路径。 origin-exe
XGPU服务的隔离功能不支持以UVM的方式申请显存,即调用CUDA API cudaMallocManaged(),更多信息,请参见NVIDIA官方文档。请使用其他方式申请显存,例如调用cudaMalloc()等。 XGPU允许用户动态禁用UVM的方式申请显存,禁用方法参考uvm_disable接口说明。
--all:显示所有待更新的RPM包。 --security:显示待更新的安全包。 --version:显示所更新到的版本号。 -a,--auto 指定更新RPM包更新方式,与-v、-p、-e互斥。 -p,--pkgs 指定需要更新的RPM包白名单列表,与-v、-a互斥。 -e,--exclude_pkgs
不需要改变,希望保留操作系统软件的配置参数,可以通过操作系统迁移的方式迁移到Huawei Cloud EulerOS。 系统迁移详见将操作系统迁移为HCE。 系统切换和迁移的区别如下表,请根据需要选择合适的替换方式。 表1 系统切换和迁移的区别 区别 系统切换 系统迁移 数据备份
则不支持动态加速。 操作步骤 本例以优化/data/apps/mysql-8.0.28/bin目录下的mysqld应用 ,为您介绍动态加速方式优化应用的操作。 生成插桩版应用并运行。 执行命令/data/hce-wae/dbo/gen_instrumentation /data/apps/mysql-8
将操作系统迁移为HCE。 如果现有的弹性云服务器配置(网卡、磁盘、VPN等配置的类型和数量)都不需要改变,操作系统软件的配置参数希望保留,可以通过操作系统迁移的方式迁移到HCE。 仅支持迁移至Huawei Cloud EulerOS 2.0标准版和Huawei Cloud EulerOS 1.1Cen
conf主要配置项 配置项 说明 [auto] auto_upgrade:指定更新RPM包更新方式。默认为False。 True:使用osmt update命令更新和使用后台osmt-agent服务自动更新两种方式都支持。 False:仅支持使用osmt update命令更新RPM包。 aut
进程,在系统的内存即将不够用时结束这些进程从而保障系统的整体可用性。 OOM相关参数 表1 OOM相关参数 参数名称 参数说明 取值 修改方式 panic_on_oom panic_on_oom参数是控制系统遇到OOM时如何反应的。当系统遇到OOM的时候,通常会有两种选择: 触发
部署并预热应用后,即可使用llvm-bolt -instrument -o -instrumentation-file命令配置应用的日志采集方式。 例如,配置test.so文件运行后每隔30秒收集一次日志,日志保存到运行时test.log文件中请使用如下命令。 llvm-bolt tests
需中断业务,先备后主,基于主备状态同步机制,平滑搬迁。 针对单机应用,CentOS搬迁需中断业务,割接式搬迁,该类搬迁方案和原应用重新部署方式等同,属于成熟方案。 华为云提供两步切换至HCE操作系统实践,本实践带您体验从CentOS迁移到Huawei Cloud EulerOS 2
emctl restart osmt-agent重启osmt-agent服务。 建议通过osmt config命令来修改配置文件,使用其他方式修改配置文件,可能导致OSMT功能异常。 升级操作必须使用root用户。 系统或RPM包的升级回退对剩余空间的要求: 剩余内存至少512M。
产品优势 华为云服务垂直整合:联合华为云擎天平台垂直优化、GuestOS/HostOS协同,提升应用性能,打造弹性云服务器、云容器引擎、弹性负载均衡、数据库等服务优选竞争力。 云原生混部优选体验:支持容器应用混部,打造业界优选的云原生资源利用效率;提供占用资源少、启动速度快、资源利用率高的云原生基础设施。
仓库配置请参考HCE获取openEuler扩展软件包。 如果要升级软件包,可参考用户指南更新HCE系统和RPM包。 yum/dnf常见使用方式 HCE 1.1仅支持通过yum命令进行软件管理相关操作,HCE 2.0同时支持yum与dnf命令。常用的软件管理相关的命令如下: 功能 yum命令
无人为触发方法,当总线故障、内存ECC校验错、cache错误、TLB错误、内部时钟错误等时会触发MCE。 fatal signal fatal signal指信号处理方式不能被设置为忽略或执行自定义处理函数的信号类型,包括SIGKILL、SIGSTOP、SIGILL等。 原理 Linux信号(signal)