检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,导致本该隔离的GPU内存页面继续使用。 处理方法 如果用户业务暂未受损,则无需处理。 通知用户停止业务,执行虚拟机迁移,并根据故障信息收集章节收集故障信息后,联系技术支持处理。 父主题: 显卡故障诊断及处理方法
终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 约束与限制 您能创建的ECS资源的数量与配额有关系,如果您想查看服务配额、扩大配额,具体请参见“调整资源配额”。 更详细的限制请参见具体API的说明。 基本概念 账号
云服务器如何升配和降配,是否需要关机? 当您购买的弹性云服务器的规格无法满足业务需要时,您可以随时变更规格,升级vCPU和内存。 在弹性云服务器列表页,单击“操作”列下的“更多 > 变更规格”,即可变更弹性云服务器的规格。 变更规格过程中,弹性云服务器需要关机,建议您选择业务空闲时间进行操作。 当您的弹性云服务器为Windows
事件概述 在日常运维中,华为云会对ECS实例所在底层宿主机的软硬件故障进行预测和主动规避。 当宿主机上的故障风险无法规避时,为避免因ECS实例的资源可用性或性能受损对您的业务造成的更大影响,系统会对受影响的实例生成事件并进行上报,例如实例重部署、本地盘换盘等,事件详细内容请参见事件类型。系统上报事件不会频繁发生。
如何查询内核信息 查询内核信息的方法如下: 登录弹性云服务器。 执行以下命令,查看内核版本。 uname -r 执行以下命令,查看安装驱动时的内核版本。 Ubuntu:find /lib/modules -name nvidia.ko CentOS:find /usr/lib/modules
准备服务器时,需要考虑服务器的CPU、内存、硬盘以及网络带宽等的配置。通常情况下,首先要满足运行网站相关软件的最低资源要求,其次需要结合网站的类型、规模以及访问量等相关因素进行相应的资源规划。 弹性云服务器的计费方式分为按需、包年/包月(按月、按年)、竞价3种,您可以根据业务的特点选择最合适的计费方式
如何处理支付订单后云服务器开通失败? 用户支付订单后,如果收到云服务器开通失败的短信,请致电华为云客服中心电话4000-955-988,客服会协助用户排除故障,开通云服务器。如果故障无法及时排除,用户可以选择取消订单,客服会做退费处理,将订单费用退还至用户的账户。 父主题: ECS创建
在运行多个docker容器的环境下NetworkManager服务占用内存很大,导致内存使用率过高。 本节操作适用于CentOS 7、Ubuntu 16.04操作系统。 该文档涉及重启网络服务,可能会造成业务中断,请谨慎操作。 问题分析 NetworkManager消耗的内存量随着容器启动
如何查询XID报错信息 XID消息是NVIDIA驱动程序向操作系统的内核日志或事件日志打印的错误报告,用于标识GPU错误事件,提供GPU硬件、NVIDIA软件或您应用程序中的错误类型、错误位置、错误代码等信息。 查询XID报错信息方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在xid相关报错,保存回显结果。
root用户用passwd命令修改管理员用户以及普通用户的密码时失败,提示passwd:Authentication token manipulation error。 根因分析 出现该问题通常是密码文件的属性的问题导致,也有可能是根目录空间满。 执行以下命令查看存放用户和密码的文件(/etc/passwd和/etc/shadow)属性。
问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。 处理方法 用户停止业务并执行业务迁移。 执行业务迁移后,根据故障信息收集收集故障信息后联系技术支持处理。
copy vbios to system memory”,可能是由于频繁加载/卸载驱动导致,建议开启驱动持久化模式,保持驱动处于加载状态。 图1 系统日志 执行以下命令,开启驱动持久化模式。 nvidia-smi -pm 1 执行以下命令,打开并编辑“/etc/rc.local”文件。
cum:表示第一列各种情况的总流量。 peak:表示第一列各种情况的流量峰值。 rates:表示第一列各种情况2秒、10秒、40秒内的平均流量。 查看带宽占用率较高的进程名。 如果消耗带宽较多的进程为业务进程,建议您变更云服务器的配置。 如果消耗带宽较多的进程为异常进程,可能是病毒
用系统初始的备份passwd-文件替换损坏的passwd文件 。 cp /etc/passwd- /etc/passwd 该操作会造成自行添加的用户丢失,如果为应用运行的用户会导致应用启动失败,待修复后请自行添加用户。 执行以下命令退出当前根目录至initramfs的根目录。 exit
问题描述 对比以往的C6云服务器,盘符是vd*格式,譬如vda、vdb,新购的C6云服务器盘符变成的sd*格式。 本节操作介绍盘符变成sd*格式的原因,以及常见的磁盘操作场景下的sd*格式盘符的处理方法,其他磁盘操作场景可参考本节示例方法。 根因分析 Linux系统的盘符是OS内部根
用户所能使用的弹性公网IP数目默认为一个,如果需要扩大弹性公网IP的配额则需要另外申请。使用负载均衡功能时,系统会自动分配一个公网IP,该公网IP属于弹性公网IP。为了避免出现弹性公网IP配额不足的情况,建议先释放弹性公网IP再申请弹性负载均衡服务。 配置特性时,未开通企业管理的用户页
页面下方展示的搜索结果包含“编辑”与“只读”两种状态,单击“编辑”,切换资源标签列表为可编辑状态。 若需要删除的标签的“键”没有展示在列表中,单击,在下拉列表中勾选需要删除的标签的“键”。勾选需要展示的标签键建议不超过10个。 单击待删除标签的弹性云服务器资源所在行的,资源标签删除完成。
solv.conf”被还原怎么办? 问题描述 在重启Ubuntu系统的ECS或者重启网络相关服务后,手动修改的/etc/resolv.conf文件被刷新,nameserver字段被还原成127.0.0.53。 图1 问题现象 根因分析 Ubuntu系统相关版本默认使用system
系统错误导致 执行以下命令,检查内核中关于文件系统的信息。 dmesg |egrep "ext[2..4]|xfs" 输出结果中如果有I/O error ... inode 的错误信息则根因为文件系统错误导致进入只读模式。 如图所示,需要修复文件系统,请先备份数据后操作,由于文件
devices were found 处理方法 查看云服务器的实例规格,确认用户使用的镜像信息。 如果使用NVIDIA Tesla T4 GPU(例如,Pi2或G6规格),请参见T4 GPU设备显示异常进行处理。 如果使用其他规格的GPU云服务器,执行下一步。 查看系统日志“/var/