检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Linux云服务器SSH登录的安全加固 Linux云服务器常用的登录方式是SSH,对于密码登录方式创建的云服务器,如何保证登录安全性呢?本文以CentOS 7.6为例,对SSH登录进行安全加固。 表1 弹性云服务器详细信息 参数 取值 名称 ecs-f5a2 操作系统 CentOS
如何查询显卡详细信息 查询指定显卡的详细信息 登录弹性云服务器。 执行以下命令,查询指定显卡的详细信息。 nvidia-smi –q –i ${显卡ID} 查询所有显卡的详细信息 登录弹性云服务器。 执行以下命令,所有显卡的详细信息。 nvidia-smi -q 执行结果示例如下:
使用Mac远程连接Windows云服务器出现报错0x207 问题描述 使用“Microsoft Remote Desktop for Mac”工具远程连接Windows操作系统云服务器时出现报错0x207。 可能原因 该问题为勾选了仅允许运行使用网络级别身份验证的远程桌面的计算机连接导致。
响应实例重部署事件 操作场景 当系统上报“实例重部署”事件时,您需要对ECS实例进行“授权重部署”操作。 本文介绍如何响应“待授权”状态的“实例重部署”事件,指导您完成实例重部署的授权操作。 授权重部署包括两种模式: 立即部署:即系统收到请求后,会立即进行实例重部署。 预约部署:
如何查询内核信息 查询内核信息的方法如下: 登录弹性云服务器。 执行以下命令,查看内核版本。 uname -r 执行以下命令,查看安装驱动时的内核版本。 Ubuntu:find /lib/modules -name nvidia.ko CentOS:find /usr/lib/modules
响应(任务类) 正常响应要素说明 名称 参数类型 说明 job_id String 提交任务成功后返回的任务ID,用户可以使用该ID对任务执行情况进行查询。如何根据job_id来查询Job的执行状态,请参考查询Job状态。 异常响应要素说明 名称 参数类型 说明 error Object
使用Mac远程连接Windows云服务器出现报错0x207 问题描述 使用“Microsoft Remote Desktop for Mac”工具远程连接Windows操作系统云服务器时出现报错0x207。 可能原因 该问题为勾选了仅允许运行使用网络级别身份验证的远程桌面的计算机连接导致。
如何处理驱动兼容性问题 问题描述 用户执行nvidia-smi命令回显报错“No devices were found”。 No devices were found 处理方法 查看云服务器的实例规格,确认用户使用的镜像信息。 如果使用NVIDIA Tesla T4 GPU(例如,Pi2或G6规格),请参见T4
查询事件 操作场景 本文介绍如何通过弹性云服务器的控制台查询系统上报的事件。 您还可以通过云监控服务的“事件监控”查看ECS实例的事件,详细内容请参见查看事件监控数据。 前提条件 如果您通过IAM用户进行本操作,则需要在操作前对IAM用户进行授权。 查询及响应事件操作依赖以下策略:
SSH连接或者服务偶发性断开问题处理 适用场景 该文档适用于在SSH连接Linux云服务器或者访问该服务器上的应用时偶现连接断开。 约束与限制 修改系统内核参数可能产生内核不稳定,请评估风险后进行操作。 为了确保系统稳定运行,修改内核参数后建议在合理的时间重启系统。 根因分析 执
加入安全组 操作场景 本节操作介绍当弹性云服务器的网卡需要增加所属安全组时的操作步骤。 支持对一台或多台弹性云服务器进行增加所属安全组的操作: 加入安全组(单台云服务器):适用于对弹性云服务器指定网卡的安全组进行操作。 加入安全组(多台云服务器):适用于对弹性云服务器主网卡的安全组进行操作。
移出安全组 操作场景 本节操作介绍当弹性云服务器的网卡需要移出所属安全组时的操作步骤。 支持对一台或多台弹性云服务器进行移出所属安全组的操作: 移出安全组(单台云服务器):适用于对弹性云服务器指定网卡的安全组进行操作。 移出安全组(多台云服务器):适用于对弹性云服务器主网卡的安全组进行操作。
如何处理显卡ERR!问题 问题描述 执行nvidia-smi命令,仅Pwr:Usage/Cap(能耗)显示ERR! 处理方法 如果当前用户业务正常,仅nvidia-smi执行后存在ERR!显示问题,无需处理。 如果当前业务已经受到影响,迁移虚拟机,再根据故障信息收集收集故障信息后联系技术支持处理。
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
VNC方式登录弹性云服务器时,登录界面显示乱码怎么办? 问题描述 使用VNC方式登录Linux云服务器,登录界面显示乱码。如图1所示。 图1 VNC登录界面乱码 可能原因 用户使用cat命令显示了一个较大二进制文件,导致云服务器登录界面显示乱码。 处理方案 使用root账号登录弹性云服务器,执行以下命令进行恢复操作。
VNC方式登录弹性云服务器时,登录界面显示乱码怎么办? 问题描述 使用VNC方式登录Linux云服务器,登录界面显示乱码。如图1所示。 图1 VNC登录界面乱码 可能原因 用户使用cat命令显示了一个较大二进制文件,导致云服务器登录界面显示乱码。 处理方案 使用root账号登录弹性云服务器,执行以下命令进行恢复操作。
配置操作系统dump 操作场景 云服务器的操作系统在运行过程中如果出现故障,可能导致系统崩溃,例如操作系统蓝屏或死机。在这种情况下,如果使用操作系统dump,系统会将内存中的数据以存储文件的形式进行保存,以便于进行云服务器的故障定位和问题分析。 本文介绍如何配置操作系统dump的方法。
更改安全组 操作场景 本节操作介绍当弹性云服务器的网卡需要变更所属安全组时的操作步骤。 支持对一台或多台弹性云服务器进行更改安全组的操作: 更改安全组(单台云服务器):适用于对弹性云服务器指定网卡的安全组进行操作。 更改安全组(多台云服务器):适用于对弹性云服务器主网卡的安全组进行操作。
GPU实例故障处理流程 GPU实例故障处理流程如图1所示,对应的操作方法如下: CES监控事件通知:配置GPU的CES监控后会产生故障事件通知。 故障信息收集:可使用GPU故障信息收集脚本一键收集,也可参考故障信息收集执行命令行收集。 GPU实例故障分类列表:根据错误信息在故障分类列表中识别故障类型。
如何处理GPU掉卡问题 问题描述 执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。 如上图所示,执行nvidia-smi命令查询到7张显卡,实际该机型应有8张显卡。 判断方式 执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev