检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
障需要下线维修。 79 GPU has fallen off the bus。总线脱落,需要下线维修 详情可以参考NVIDIA的Xid描述文档:https://docs.nvidia.com/deploy/xid-errors/index.html。 处理方法 执行dmesg |
fault,非硬件故障,可能访问了非法地址等。 43 GPU stopped processing, 非硬件故障,可能是自身软件错误。 详情可以参考NVIDIA的Xid描述文档:https://docs.nvidia.com/deploy/xid-errors/index.html。 处理方法 尝试重新运行作业并观察Xid错误是否消失。
Generator”中恢复格式正确的公钥文件内容,如图2所示,红框中的内容即为符合系统要求的公钥文件。 图2 恢复公钥文件内容 复制红框中的公钥内容,并将其粘贴在文本文档中,以.txt格式保存在本地,保存公钥文件。 将公钥文件导入管理控制台。 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 选择“计算
net.core.wmem_max 最大的TCP数据发送窗口(字节)。 net.core.netdev_max_backlog 在每个网络接口接收数据包的速率比内核处理这些包的速率快时,允许送到队列的数据包的最大数目。 net.core.somaxconn 定义了系统中每一个端口
查看操作系统dump(Windows) 本文以Windows Server 2016版本操作系统为例进行介绍,更多版本的操作,请参考对应操作系统官网帮助文档。 远程登录云服务器。 根据配置操作系统dump(Windows)中设置的转储文件路径,可以查看到操作系统dump的内核转储文件。 例如,
GPU实例故障分类列表 GPU实例故障的分类列表如表1所示。 表1 GPU实例故障分类列表 是否可恢复故障 故障类型 相关文档 可恢复故障,可按照相关文档自行恢复 镜像配置问题 如何处理Nouveau驱动未禁用导致的问题 ECC错误 如何处理ECC ERROR:存在待隔离页问题 内核升级问题
this connection 图1 network启动失败 适用场景 CentOS、RedHat、Euleros系列操作系统。 约束与限制 该文档中涉及重启网卡的操作,重启网卡会出现网络暂时断开,请谨慎操作。 根因分析 启动network时会读取/etc/sysconfig/netw
com/get/mysql80-community-release-el7-11.noarch.rpm 免费 PHP 是一款开源软件,用于Web开发。 获取方式: https://mirrors.huaweicloud.com/remi/enterprise/remi-release-7
SELinux policy, freezing. ”错误,具体报错信息如下图所示。 可能原因 出现该报错由于当前操作系统开启了SElinux。 该文档适用于CentOS系统,在该版本的系统上开启了SELinux,可能会触发该问题。 处理方法 Linux云服务器启动后,在出现内核选项时按字母键e进入内核编辑模式。
推荐使用公共镜像创建云服务器,公共镜像均已支持DHCP持续获取能力。 处理方法(Linux) 本文以CentOS 7.2为例进行介绍,其他版本操作系统请参考对应操作系统帮助文档。 登录Linux云服务器,执行如下命令,查看是否存在dhclient进程。 ps -ef | grep dhclient 若dhclie
ECS涉及以下几项费用: 云服务器 云硬盘 弹性公网IP 具体的计费方式及标准请参考计费模式概述。 JDK Java开发工具软件。 免费 Jenkins 基于Java开发的一种持续集成工具,用于监控持续重复的工作。 获取方式: https://pkg.jenkins.io/redhat-stable/jenkins
如果您对价格有疑问,可以在页面底部,单击“配置费用”右侧的“了解计费详情”来了解产品价格。 图1 了解计费详情 (可选)单击“生成Open API最佳实践脚本”。 支持Java、Python、Go、.NET、NodeJs、PHP、C++等编程语言。 如下配置信息暂不支持生成: 故障域(云服务器组策略)
单位:百分比 采集方式(Linux):通过计算/proc/pid/stat的变化得出。 采集方式(Windows):通过Windows API GetProcessTimes获取进程CPU使用率。 0-1*CPU核心数 云服务器 1分钟 proc_pHashId_mem 内存使用率
在运行多个docker容器的环境下NetworkManager服务占用内存很大,导致内存使用率过高。 本节操作适用于CentOS 7、Ubuntu 16.04操作系统。 该文档涉及重启网络服务,可能会造成业务中断,请谨慎操作。 问题分析 NetworkManager消耗的内存量随着容器启动/停止的每次迭代而增加,
镜像部署LNMP环境(CentOS7.4 PHP7.2) 简介 LNMP是由Linux、Nginx、MySQL和PHP建立的web应用平台。 本文档指导用户使用华为云市场镜像“LNMP平台(CentOS7.4 Nginx PHP7.2)”部署LNMP环境。 操作步骤 在华为云市场搜索“LNMP平台(CentOS7
错误。 数据库使用Windows API的(例如 ReadFile、 写文件,ReadFileScatter,WriteFileGather)执行I/O操作。执行这些I/O操作时,数据库会检查任何与这些API调用相关联的错误情况。如果这些API调用失败并出现操作系统错误,数据库将
sh命令,将信息收集到信息文件diagnose_gpu_xxxxx.tar.gz进行自排查或工单联系技术支持。 使用命令获取信息请参考表1。 表1 获取信息方法 信息分类 相关文档 显卡基本信息 如何获取显卡ID 如何查询显卡详细信息 如何查询显卡在位信息 显卡故障信息(Linux) 如何查询NVIDIA的错误信息 如何查询XID报错信息
方案二 修改网卡接口指定区域,使其与防火墙规则处于同一区域,具体操作如下。 执行如下命令,修改网卡接口指定区域。 firewall-cmd --zone=public --change-interface=eht0 图8 修改网卡接口指定区域 执行如下命令,查看网卡接口指定区域。 firewall-cmd
操作场景 使用SSH方式登录CentOS 6.5操作系统的云服务器时,过一段时间就会自动断开连接。本节操作介绍如何保持SSH会话持续连接不断开 该文档适用于CentOS/EulerOS系统。 本节操作涉及重启sshd服务,会造成sshd断开。 操作方法 编辑/etc/ssh/sshd_config文件设置心跳,保持连接。
SSH连接或者服务偶发性断开问题处理 适用场景 该文档适用于在SSH连接Linux云服务器或者访问该服务器上的应用时偶现连接断开。 约束与限制 修改系统内核参数可能产生内核不稳定,请评估风险后进行操作。 为了确保系统稳定运行,修改内核参数后建议在合理的时间重启系统。 根因分析 执