检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
更新RPM包 准备工作 osmt update命令更新 osmt-agent服务自动更新 父主题: 使用OSMT工具升级
XGPU共享技术 XGPU共享技术概述 安装并使用XGPU XGPU算力调度示例
将操作系统迁移至HCE 2.0 约束限制 迁移操作 冲突包列表 父主题: 系统迁移
更新HCE系统和RPM包 升级概述 使用dnf或yum命令升级 使用OSMT工具升级 附录
HCE支持使用dnf/yum命令和OSMT工具两种升级方式。 Linux自身支持dnf/yum命令,可对RPM包进行升级和回退,升级操作简单。 OSMT是华为云提供的对HCE系统及RPM包升级和回退的工具,可自定义升级范围和定时检查、延迟重启。 两种升级方式区别如下。 表1 升级方式区别 项目 使用dnf或yum命令升级
无人为触发方法,当总线故障、内存ECC校验错、cache错误、TLB错误、内部时钟错误等时会触发MCE。 fatal signal fatal signal指信号处理方式不能被设置为忽略或执行自定义处理函数的信号类型,包括SIGKILL、SIGSTOP、SIGILL等。 原理 Linux信号(signal)
service # the timeout of query systemd services check_systemd_running_jobs = True query_timeout = 30 check_rpm_packages = True 表1 osmt.conf不建议修改的配置项
st以20为例,介绍使用不同调度策略时对算力的调度示例。 原生调度(policy=0) 原生调度表示使用NVIDIA GPU本身的算力调度方式。在原生调度策略下XGPU只用来做显存的隔离。 固定算力调度(policy=1) 固定算力调度表示以固定的算力百分比为容器分配算力。例如为
$releasever base baseurl=https://repo.huaweicloud.com/hce/$releasever/os/$basearch/ enabled=1 gpgcheck=1 gpgkey=https://repo.huaweicloud.com/
jboss-jaxrs-2.0-api maven-shared-utils tagsoup cdi-api libbase geronimo-annotation pentaho-reporting-flow-engine maven-resolver-api apache-commons-codec
算力支持最小1%粒度的划分,推荐最小算力不低于4%。 兼容性好 不仅适配标准的Docker和Containerd工作方式,而且兼容Kubernetes工作方式。 操作简单 无需重编译AI应用,运行时无需替换CUDA库。 父主题: XGPU共享技术
[mission]优化运行中的应用所要配置的参数。 log-type 运行时日志采集方式,当前仅支持instrument方式。 hotpatch-type 热补丁模式,当前仅支持mode1即ptrace方式。 snapshot-path 优化后的二进制快照文件存放的目录路径。 origin-exe
--all:显示所有待更新的RPM包。 --security:显示待更新的安全包。 --version:显示所更新到的版本号。 -a,--auto 指定更新RPM包更新方式,与-v、-p、-e互斥。 -p,--pkgs 指定需要更新的RPM包白名单列表,与-v、-a互斥。 -e,--exclude_pkgs
则不支持动态加速。 操作步骤 本例以优化/data/apps/mysql-8.0.28/bin目录下的mysqld应用 ,为您介绍动态加速方式优化应用的操作。 生成插桩版应用并运行。 执行命令/data/hce-wae/dbo/gen_instrumentation /data/apps/mysql-8
将操作系统迁移为HCE。 如果现有的弹性云服务器配置(网卡、磁盘、VPN等配置的类型和数量)都不需要改变,操作系统软件的配置参数希望保留,可以通过操作系统迁移的方式迁移到HCE。 仅支持迁移至Huawei Cloud EulerOS 2.0标准版和Huawei Cloud EulerOS 1.1Cen
5.10内核贡献TOP1;南北向主流软硬件支持,可完全替代CentOS。 OS开箱即用:支持安装KooCLI,提供通过CLI调用云服务API的方法;支持安装管理鸿蒙SDK的工具sdkmgr,方便远程管理鸿蒙SDK,实现端云开发者协同。
部署并预热应用后,即可使用llvm-bolt -instrument -o -instrumentation-file命令配置应用的日志采集方式。 例如,配置test.so文件运行后每隔30秒收集一次日志,日志保存到运行时test.log文件中请使用如下命令。 llvm-bolt tests
又增加云上的生态能力。 云和端生态协同。 HCE同时支持云侧和端侧开发应用,是云端协同的优选选择。 云和端应用开发功能互相协同(例如通过API实现端云交互),业务运行时资源按需弹性扩展,让应用同时具备端和云的优势。
emctl restart osmt-agent重启osmt-agent服务。 建议通过osmt config命令来修改配置文件,使用其他方式修改配置文件,可能导致OSMT功能异常。 升级操作必须使用root用户。 系统或RPM包的升级回退对剩余空间的要求: 剩余内存至少512M。