检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
详情可以参考NVIDIA的Xid描述文档:https://docs.nvidia.com/deploy/xid-errors/index.html。 处理方法 尝试重新运行作业并观察Xid错误是否消失。 若错误持续存在,尝试检查代码或分析日志,确认是否为程序引入的Xid故障。 若确认不是程序引入,请联系技术支持处理。
Service,HSS)是提升服务器整体安全性的服务,通过主机管理、风险防御、入侵检测、安全运营、网页防篡改功能,可全面识别并管理云服务器中的信息资产,实时监测云服务器中的风险,降低服务器被入侵的风险。 使用主机安全需要在云服务器中安装Agent。安装Agent后,您的云服务器将受到HSS云端防护中心全方位的安全保障
/var/crash 默认是保存在/var/crash目录下,如果要保存到其他目录,则改成对应的目录, 例如保存在/home/kdump下,则改成: path /home/kdump 要确保指定的路径有足够的空间保存vmcore,建议剩余空间不小于RAM大小;也可以保存在SAN,nfs等共享设备上。
64bit操作系统,GPU实例安装CUDA 10.1对应的Tesla驱动为例。 Linux内核版本和驱动的版本存在兼容性关系。如果驱动安装失败,请检查驱动安装日志(安装日志通常位于/var/log/nvidia-installer.log)。 日志中如提示失败原因为驱动编译错误,例如 ge
弹性云服务器实例正常运行状态。 在这个状态的实例可以运行您的业务。 正在关机 中间状态 弹性云服务器实例从运行中到关机的中间状态。 关机 稳定状态 弹性云服务器实例被正常停止。 在这个状态下的实例,不能对外提供业务。 重启中 中间状态 弹性云服务器实例正在进行重启操作。 更新规格中 中间状态
高计算能力、高吞吐量的场景。例如科学计算、基因工程、游戏动画、生物制药计算和存储系统。 推荐使用高性能计算型弹性云服务器,主要使用在受计算限制的高性能处理器的应用程序上,适合要求提供海量并行计算资源、高性能的基础设施服务,需要达到高性能计算和海量存储,对渲染的效率有一定保障的场景。 更多信息,请参见高性能计算型。
please try again.”错误 问题描述 使用SSH登录Linux云服务器时,输入正确的用户名和密码后,也无法正常登录。 执行cat /var/log/secure命令查看secure日志时提示如下错误信息。 Permission denied, please try again
无公网IP的弹性云服务器访问Internet SNAT 通过公网NAT网关的SNAT规则访问公网 无公网IP的弹性云服务器对互联网提供服务 DNAT 通过公网NAT网关的DNAT规则面向公网提供服务 通过Linux操作系统的代理主机 本方案需要: 已拥有一台绑定了公网IP的弹性云服务器作为代理弹性云服务器。
code=exited”错误 问题描述 在Linux系统的ECS实例中,使用service或systemctl命令启动SSH服务时,命令行没有返回任何报错信息,但服务没有正常运行。 执行cat /var/log/secure查看secure日志,发现类似如下错误信息。 sshd.service:
ECS系统内存不足,系统当前的线程数达到了配置的最大值。 处理方法 登录管理控制台。 通过ECS的主机监控功能的“内存使用率”指标,查看云服务器内存使用情况确认云服务器内存情况,详细操作,请参见查看监控指标 。 如果内存不足,建议扩容内存或者优化内存的使用,扩容内存可参考变更规格通用操作。
系统级别的认证信息,例如密码策略、用户信息和访问控制等。 每个启用PAM的应用程序,在/etc/pam.d目录中都有对应的同名配置文件。例如,login命令的配置文件是/etc/pam.d/login,可以在相应配置文件中配置具体的策略。检查相应配置文件中,是否有类似如下配置信息。 auth
登录弹性云服务器。 执行以下命令编辑sshd服务的配置文件。 vi /etc/ssh/sshd_config 将#port 22 这一行的井号注释符去掉,修改22为2020。 图5 修改为2020端口 按“ESC”退出编辑模式,输入“:wq!”保存退出。 执行以下命令重启sshd服务。 service
选择“高级”页签,并单击“性能”栏的“设置”。 系统打开“性能选项”窗口。 图1 性能选项 选择“高级”页签,并单击“处理器计划”栏的“后台服务”。 单击“虚拟内存”栏的“更改”。 系统打开“虚拟内存”窗口。 根据业务需求配置虚拟内存: 自动管理所有驱动器的分页文件大小:取消勾选。 驱动器:选择虚拟内存文件存放的驱动器。
否,请执行下一步。 查看系统日志“/var/log/message”,是否存在驱动相关报错。 如果出现“Failed to copy vbios to system memory”,可能是由于频繁加载/卸载驱动导致,建议开启驱动持久化模式,保持驱动处于加载状态。 图1 系统日志 执行以下命令,开启驱动持久化模式。
如何查询NVIDIA的错误信息 查询NVDIA错误信息的方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在error信息,保存回显结果。 dmesg | grep -i nvidia 也可过滤关键字后保存结果,例如:NVRM、nouveau、nvidia、nv字样等。 父主题:
单击“创建成功资源退订”页签。 单个资源退订与批量退订可使用不同的操作方式: 退订单个资源:单击待退订资源所在行的“退订资源”。 批量退订:在退订列表中勾选需要退订的资源,单击列表左上角的“退订资源”。 查看退订信息,勾选“我已确认本次退订金额和相关费用”后,单击“退订”。 父主题: ECS删除与退订
也可以通过查询dhclient租约信息记录文件,每一次续租成功都会记录在该文件中。执行以下命令查询文件的保存路径(文件以.lease结尾)。 ps -ef |grep dhclient 继续查看系统日志(messages)发现在续租后的5小时14分后系统时间发生跳变,回退至4月
执行以下命令,查看系统日志定位出错的文件 grep Module /var/log/messages 图5 系统日志 编辑系统日志中提示的错误文件,并注释或修改错误行。 vi /etc/pam.d/login 图6 修改错误信息 重启服务器,重试连接云服务器。 如需查看修改记录,定位是否人为错误修改导致,请执行以下命令。
执行以下命令,查看系统日志定位出错的文件 grep Module /var/log/messages 图5 系统日志 编辑系统日志中提示的错误文件,并注释或修改错误行。 vi /etc/pam.d/login 图6 修改错误信息 重启服务器,重试连接云服务器。 如需查看修改记录,定位是否人为错误修改导致,请执行以下命令。
随着网络IO的带宽不断提升,单核CPU处理网络中断存在瓶颈,不能完全满足网卡的需求,通过开启网卡多队列功能,您可以将弹性云服务器中的网卡中断分散给不同的CPU处理,以满足网卡的需求,从而提升网络PPS和带宽性能。 假设以下场景所述的弹性云服务器满足规格和虚拟化类型要求: 使用网卡