检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
运行容器镜像的HCE系统版本和制作的HCE容器镜像版本须保持一致。 制作镜像归档文件 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base] name=HCE $releasever base baseurl=https://repo
准备工作 准备一台ECS,并分配公网IP或者弹性公网IP(EIP)。 安全组入方向已放开9092端口 操作步骤 安装kafka软件。 执行以下命令安装软件。 dnf install kafka 执行结束后,Kafka会被安装到/opt/kafka目录。 软件配置。 编辑“/opt
安装工具 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base] name=HCE $releasever base baseurl=https://repo.huaweicloud.com/
OOM优先级策略开关。 0:不开启优先级配置。当OOM时,按照系统原有的OOM操作结束进程,结束内存消耗最大的进程,回收内存。 1:开启优先级配置并以cgroup为粒度。当OOM时,结束优先级低的cgroup所有进程,并回收内存。 2:开启优先级配置并以单个进程个为粒度。当OOM时,结
例如,某个网卡上已经设置过tc qdisc规则的情况下,对此网卡使能网络QoS功能可能会失败。 使用方法 安装oncn-tbwm软件包。 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base]
autorelabel文件确保下次不会再重复执行relabel动作。 打开配置文件/etc/selinux/config,设置SELINUX=permissive,并执行reboot重启操作系统。 再次打开配置文件/etc/selinux/config,设置SELINUX=enforcing,并执行reboot重启操作系统。
update命令更新 手动更新RPM包有两种方式。 根据配置文件中的filters字段更新RPM包。 osmt update --auto --reboot_config [重启配置] 表1 重启配置参数说明 参数 说明 never 若未指定重启配置参数,或指定为never时,更新结束后,不重启。
版本升级或回退时,会同时将RPM包更新到目标系统对应的RPM包版本,和osmt.conf配置文件中的黑白名单rpm列表无关。 版本升级 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base] name=HCE $releasever
XGPU算力调度示例 当使用XGPU服务创建XGPU时,XGPU服务会按照最大容器数量(max_inst)为每张显卡设置时间片(X ms)用于为容器分配GPU算力,以单元1、单元2…单元N表示。本节max_inst以20为例,介绍使用不同调度策略时对算力的调度示例。 原生调度(policy=0)
如果在RPM包更新后,系统配置被修改(sysctl -a可查询系统配置),则存在无法使用OSMT工具升级的情况。可用sysctl命令刷新系统配置,sysctl -p <file>可指定生效的配置文件。sysctl --system可应用所有系统目录下的配置文件,如果使用该命令,需要提前确认所有系统目录下的内核配置文件。
XGPU通过自研的内核驱动为容器提供虚拟的GPU设备,在保证性能的前提下隔离显存和算力,为充分利用GPU硬件资源进行训练和推理提供有效保障。您可以通过命令方便地配置容器内的虚拟GPU设备。 图1 XGPU共享技术架构图 产品优势 节约成本 随着显卡技术的不断发展,单张GPU卡的算力越来越强,同时价格也
接口示例 按如下所示创建3个cgroup节点A、B、C,配置并查看qos_level接口。 表2 数据规划 cgroup组 cpu.qos_level A 1 B -2 C 2 创建cgroup A及子节点B、C,依次设置A、B、C的cpu调度优先级为1、-2、2。 cgroup
kd,用来定期遍历系统中的所有进程,检查是否存在处于D状态超过设置时长(默认120秒)的进程。如果存在这样的进程,则打印并上报相关警告和进程堆栈。如果配置了hung_task_panic(通过proc或内核启动参数配置),则直接发起panic。 触发方法 创建内核线程,设成D状态,scheduler释放时间片。
运行插桩文件获取进程PID,本例为87042。 创建mysqld的应用加速动态配置文件。 每一个待优化的应用都要有一个对应的配置文件,应用加速工具根据此配置文件对应用进行动态加速。 执行如下命令复制一份默认的配置文件为/data/hce-wae/config/mysqld.conf。 [root@localhost]#
修改语言环境为中文后,再执行sulogin终端显示出现乱码,如下图所示: 解决方法 执行sulogin命令时,可以临时设置LANG环境变量为英文,比如将LANG设置为en_US.UTF-8:
概述 OSMT是华为云提供的对HCE系统及RPM包升级和回退的工具。OSMT可自定义配置RPM包的升级范围,并支持周期性定时升级、在指定的时间段单次升级、延时升级并重启等功能。 版本升级和回退:介绍对整体HCE系统的升级及回退操作。 更新RPM包:介绍仅对RPM包的升级和回退操作。
器,然后打开新终端。在新终端中,就可以使用原生的clang编译语言。 安装毕昇编译器 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base] name=HCE $releasever base
加到应用程序的最后链接步骤中。 采集应用运行时的日志数据。 部署并预热应用后,即可使用llvm-bolt -instrument -o -instrumentation-file命令配置应用的日志采集方式。 例如,配置test.so文件运行后每隔30秒收集一次日志,日志保存到运行时test
使用以下命令验证Java默认版本: java -version 若目标机器上已安装Java1.8.0,则自动执行后续扫描。 若目标机器上未安装Java1.8.0时,根据操作系统的不同处理方式有所不同。 操作系统是HCE 2.0时,会自动安装缺失的Java依赖:java-1.8.0-openjdk-devel、java-1
安装安全更新 执行yum upgrade --security命令,安装全部安全更新。 [root@localhost ~]# yum upgrade --security Last metadata expiration check: 5:21:24 ago on Tue 13