-
如何收集NVIDIA日志 - 弹性云服务器 ECS
如何收集NVIDIA日志 收集NVIDIA日志方法如下: 登录弹性云服务器。 在任意目录下执行以下命令。(如果是CCE场景,进入到/opt/cloud/cce/nvidia/bin目录后执行) sh nvidia-bug-report.sh 或 ./nvidia-bug-report
-
如何收集驱动安装信息 - 弹性云服务器 ECS
如何收集驱动安装信息 收集驱动安装信息的方法如下: 登录弹性云服务器。 执行以下命令,检查是否禁用了nouveau驱动。 lsmod | grep nouveau 如果是驱动安装失败类问题,收集/var/log/nvidia-installer.log 驱动安装日志,并转储日志信息。
-
如何处理infoROM错误 - 弹性云服务器 ECS
如何处理infoROM错误 问题描述 Linux操作系统的云服务器在执行nvidia-smi命令报错“WARNING:infoROM is corrupted at gpu 0000:00:0D.0”,并且用户业务已经受到影响。 问题原因 健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。
-
如何查询XID报错信息 - 弹性云服务器 ECS
如何查询XID报错信息 XID消息是NVIDIA驱动程序向操作系统的内核日志或事件日志打印的错误报告,用于标识GPU错误事件,提供GPU硬件、NVIDIA软件或您应用程序中的错误类型、错误位置、错误代码等信息。 查询XID报错信息方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在xid相关报错,保存回显结果。
-
认证鉴权 - 弹性云服务器 ECS
Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头中,从而通过身份认证,获得操作API的权限。T
-
如何备份本地盘数据? - 弹性云服务器 ECS
根据待备份本地盘数据的容量大小,创建本地盘。 新创建的云硬盘需要与待备份本地盘的弹性云服务器位于同一区域、同一可用区。 详细操作,请参见新增磁盘。 挂载云硬盘。 将创建的云硬盘挂载至待备份本地盘的弹性云服务器。 详细操作,请参见挂载磁盘。 备份本地盘数据。 将本地盘中需要备份的数据,备份至新挂载的云硬盘中。
-
标签概述 - 弹性云服务器 ECS
查看到对应的标签。 有关标签的基本知识 标签用于标识资源,当您拥有相同类型的许多云资源时,可以使用标签按各种维度(例如用途、所有者或环境)对云资源进行分类。 图1 标签示例 图1说明了标签的工作方式。在此示例中,您为每个云资源分配了两个标签,每个标签都包含您定义的一个“键”和一
-
FPGA加速型 - 弹性云服务器 ECS
让您的应用不再受限硬件配置。 硬件加速器资源池 FPGA云服务的硬件加速资源以池化的形式呈现,像分配CPU资源一样,按照您的需求分配最合适、最经济的FPGA资源。通过FPGA虚拟化技术、隔离技术和分布式技术,可以实现节点内FPGA资源的共享,而这一切对您的业务都是透明的,从而最大化满足您业务的硬件加速需求。
-
如何查询显卡在位信息 - 弹性云服务器 ECS
如何查询显卡在位信息 查询显卡在位信息方法如下: 登录弹性云服务器。 执行以下命令,查看显卡在位情况,确认是否和服务器规格显卡数一致,保存回显结果。 lspci | grep NV 如下图所示,可以看到有一张GPU显卡,且显卡是rev a1,状态正常;如果为rev ff或其他状态,则显卡可能故障。
-
如何查询显卡详细信息 - 弹性云服务器 ECS
如何查询显卡详细信息 查询指定显卡的详细信息 登录弹性云服务器。 执行以下命令,查询指定显卡的详细信息。 nvidia-smi –q –i ${显卡ID} 查询所有显卡的详细信息 登录弹性云服务器。 执行以下命令,所有显卡的详细信息。 nvidia-smi -q 执行结果示例如下:
-
AI加速型 - 弹性云服务器 ECS
310)芯片为加速核心的AI加速型弹性云服务器。基于Ascend 310芯片低功耗、高算力特性,实现了能效比的大幅提升,助力AI推理业务的快速普及。通过AI推理加速型实例Ai1s将Ascend 310芯片的计算加速能力在云平台上开放出来,方便用户快速简捷地使用Ascend 310芯片强大的处理能力。
-
如何使用auditd记录Linux系统文件改动 - 弹性云服务器 ECS
如何使用auditd记录Linux系统文件改动 auditd是Linux审计系统的用户空间组件,可以记录操作系统中的操作日志,包括文件读写、系统调用的记录等,出现问题可以用于审计。本文以CentOS 7.4 64位操作系统为例介绍auditd工具的安装和配置。 auditd相关工具命令与配置文件
-
如何处理GPU掉卡问题 - 弹性云服务器 ECS
如何处理GPU掉卡问题 问题描述 执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。 如上图所示,执行nvidia-smi命令查询到7张显卡,实际该机型应有8张显卡。 判断方式 执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev
-
KVM实例变更至QingTian实例后出现蓝屏或业务异常,如何回滚至初始规格? - 弹性云服务器 ECS
不同架构实例加载的协议和驱动不同,其中: Windows操作系统的KVM实例挂载virtio-blk协议的系统盘及对应的驱动。 Windows操作系统的QingTian实例挂载virtio-scsi协议的系统盘及对应的驱动。 对于Windows 2016操作系统的云服务器,从Qi
-
Ubuntu操作系统如何设置默认启动内核 - 弹性云服务器 ECS
如图1所示。 图1 修改GRUB_DEFAULT 1>2中的1指的是主菜单第二个选项。 1>2中的2指的是主菜单第二个选项中的第三个启动内核选项。 1>2中的>分隔符号前后不带空格。 整个条目使用一组引号。 执行以下命令,重新生成grub配置文件。 update-grub 父主题: 操作系统类(Linux)
-
成本管理 - 弹性云服务器 ECS
找节约成本的机会。您还可以根据成本分析阶段的分析结果识别成本偏高的资源,通过云监控服务监控资源的使用情况,确定成本偏高的原因,然后采取针对性的优化措施。 监控资源利用率,评估当前配置是否过高。例如:CPU、内存、云硬盘、带宽等资源的利用率。 监控闲置的资源,避免浪费。例如:未挂载的云硬盘、未绑定的EIP等。
-
如何在Linux实例中配置静态IP地址? - 弹性云服务器 ECS
执行以下命令,查看实例的IP地址和子网掩码。 ip a 如下图显示实例当前的IP地址及网段为:172.19.126.101/15 ifconfig -a 如下图显示实例当前的子网掩码为:255.254.0.0 执行以下命令,查看实例当前的网关和默认路由信息。 ip route 如下图显示实例当前的网关为:172
-
ping不通或丢包时如何进行链路测试? - 弹性云服务器 ECS
0.0 0.0 0.0 主要输出的信息如下: HOST:节点的IP地址或域名。 Loss%:丢包率。 Snt:每秒发送的数量包的数量。 Last:最近一次的响应时间。 Avg:平均响应时间。 Best:最短的响应时间。 Wrst:最长的响应时间。 StDev:标准偏差,偏差
-
Linux如何创建swap分区/swap文件 - 弹性云服务器 ECS
Linux如何创建swap分区/swap文件 适用场景 本节操作以CentOS 6.8操作系统云服务器为例,指导用户创建swap分区。 约束与限制 操作过程中涉及创建指定大小的文件,请确认系统磁盘空间有足够的空余空间。 场景一:使用块设备创建swap 执行以下命令,新建一个分区(以2G为例)。
-
如何查看ECS实例是否支持IPv6? - 弹性云服务器 ECS
如何查看ECS实例是否支持IPv6? 不同区域、不同可用区支持IPv6的云服务器规格不同。请在购买弹性云服务器页面,选择区域和可用区后,准确查询ECS实例规格是否支持IPv6,查询方法如下图所示。 图1 查询支持IPv6的ECS规格 当ECS规格列表中包含“IPv6”参数,且取值