检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU实例故障分类列表 GPU实例故障的分类列表如表1所示。 表1 GPU实例故障分类列表 是否可恢复故障 故障类型 相关文档 可恢复故障,可按照相关文档自行恢复 镜像配置问题 如何处理Nouveau驱动未禁用导致的问题 ECC错误 如何处理ECC ERROR:存在待隔离页问题 内核升级问题
查看到的CPU核数是规格的Flavor名称中展示的vCPU数量的一半。 例如,对于c7.xlarge.2,其vCPU数,即逻辑内核数为4,2核的物理CPU包含4个vCPU(线程)。若关闭了超线程,则在c7.xlarge.2弹性云服务器上查看到的CPU核数是2。 关于超线程的详细介绍,请参见开启/关闭超线程。
CVE-2017-5753漏洞是通过内核补丁修复的,它无法禁用,并且它在Red Hat的性能测试中没有显示出任何可见的影响。 关闭Meltdown安全漏洞补丁 如果您想降低开启pti对系统的性能影响或者系统有更好的保护机制,您可以根据以下步骤操作: 根据不同的操作系统修改内核参数: CentO
GPU实例故障处理流程如图1所示,对应的操作方法如下: CES监控事件通知:配置GPU的CES监控后会产生故障事件通知。 故障信息收集:可使用GPU故障信息收集脚本一键收集,也可参考故障信息收集执行命令行收集。 GPU实例故障分类列表:根据错误信息在故障分类列表中识别故障类型。 非硬件故
NVLink技术,实现GPU之间的直接通信,提升GPU之间的数据传输效率。能够提供超高的通用计算能力,适用于AI深度学习、科学计算,在深度学习训练、科学计算、计算流体动力学、计算金融、地震分析、分子建模、基因组学等领域都能表现出巨大的计算优势。 规格 表8 P2vs型弹性云服务器的规格 规格名称 vCPU
签,单击,在下拉列表中勾选创建的标签键。 默认该标签键的值为“无标签”,您还需要为每一个资源对应的标签值赋值,完成标签与资源的关联,继续下一步。 图4 资源列表 单击“编辑”,切换资源标签列表为可编辑状态。 在云服务器资源所在行,单击,输入标签“值”(例如:A)。 为标签键赋值后
GPU实例故障,如果已安装GPU监控的CES Agent,当GPU服务器出现异常时则会产生事件通知,可以及时发现问题避免造成用户损失。如果没有安装CES Agent,只能依赖用户对故障的监控情况,发现故障后及时联系技术支持处理。 GPU实例故障处理流程 GPU实例故障分类列表 故障信息收集 非硬件故障自恢复处理方法
sector”表示起始磁柱值,可以选择2048-209715199,默认为2048。 以选择默认起始磁柱值2048为例,按“Enter”。 系统会自动提示分区可用空间的起始磁柱值和截止磁柱值,可以在该区间内自定义,或者使用默认值。起始磁柱值必须小于分区的截止磁柱值。 回显类似如下信息:
如何查询XID报错信息 XID消息是NVIDIA驱动程序向操作系统的内核日志或事件日志打印的错误报告,用于标识GPU错误事件,提供GPU硬件、NVIDIA软件或您应用程序中的错误类型、错误位置、错误代码等信息。 查询XID报错信息方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在xid相关报错,保存回显结果。
GPU加速型ECS的GRID驱动。 如果需要实现计算加速能力,则需要安装Tesla驱动。 使用公共镜像创建的计算加速型(P系列)实例默认已安装特定版本的Tesla驱动。 使用私有镜像创建的GPU加速型实例,如需安装Tesla驱动请参考手动安装GPU加速型ECS的Tesla驱动。 表1
功后显示如图20所示的界面。 图20 个人主页 选择“站点管理”即可体验完整的管理功能。 如下为选择“站点管理 > 课程 > 管理课程和分类”,进入“管理课程分类和课程”页面。 图21 站点管理 购买域名。 为了便于网站的访问和使用,可以给网站设置一个单独的域名,使用域名访问网站
个“值”,一个标签使用键为“所有者”,另一个使用键为“用途”,每个标签都拥有相关的值。 您可以根据为云资源添加的标签快速搜索和筛选特定的云资源。例如,您可以为账户中的资源定义一组标签,以跟踪每个云资源的所有者和用途,使资源管理变得更加轻松。 标签命名规则 每个标签由一对键值对(Key-Value)组成。
核对云服务器运行的应用程序中是否有对网络和CPU要求高的需求,如果是,建议您变更云服务器的配置或修改带宽。 如果云服务器配置已经比较高,建议考虑云服务器上应用场景的分离部署,例如将数据库和应用分开部署。 异常进程分析处理建议 如果CPU或带宽利用率高是由于病毒、木马入侵导致的,那么需要手动结束进程。建议的处理顺序如下:
核对云服务器运行的应用程序中是否有对网络和CPU要求高的需求,如果是,建议您变更云服务器的配置或修改带宽。 如果云服务器配置已经比较高,建议考虑云服务器上应用场景的分离部署,例如将数据库和应用分开部署。 异常进程分析处理建议 如果CPU或带宽利用率高是由于病毒、木马入侵导致的,那么需要手动结束进程。建议的处理顺序如下:
如何实现对弹性云服务器的分组管理? 弹性云服务器未提供云服务器的文件夹管理能力,若要对云服务器进行分组管理,可以通过标签功能实现类似的效果。 通过标签功能,您可以按不同维度,例如用途、使用者等,对云服务器进行分类,从而实现分组管理的目的。 更多关于标签功能的介绍,请参考标签概述。
监控闲置的资源,避免浪费。例如:未挂载的云硬盘、未绑定的EIP等。 计费模式优化 不同类型的业务对资源使用周期有不同的要求,为每一类业务确定合适的计费模式,灵活组合以达到最优效果。 针对长期稳定的成熟业务,使用包年/包月计费模式。 针对不能中断的短期、突增或不可预测的业务,使用按需计费模式。 针对无状态Web服务、离线分析等业务,使用竞价计费模式。
占用大量的CPU资源。 使用top命令终止CPU占用率高的进程 您可以直接在top运行界面快速终止相应的异常进程。操作步骤如下: 在top命令运行的同时,按下小写的“k”键。 输入要终止进程的PID。 进程的PID为top命令回显的第一列数值。例如,要终止PID为52的进程,直接输入“52”后回车。
与其他服务的关系 弹性云服务器与周边服务的依赖关系如图1所示。 图1 弹性云服务器与其他服务的关系示意图 弹性云服务器与其他服务的关系 表1 弹性云服务器与其他服务的关系 服务名称 弹性云服务器与其他服务的关系 主要交互功能 弹性伸缩 弹性伸缩支持自动调整弹性云服务器资源,可按照
Joomla是一套全球知名的内容管理系统,即Joomla CMS(Content Management System)。Joomla是使用PHP语言加上Mysql数据开发的软件系统,是网站的一个基础管理平台,适合从个人网站到各种企业网站、分类信息系统、电商销售类型的各类网站。 本文档指
当您购买的弹性云服务器规格无法满足业务需要时,可参考本章节变更规格,升级vCPU、内存。对于部分类型的弹性云服务器,您还可以在变更规格时,更换弹性云服务器的类型。 “XEN实例”变更为“KVM实例”,需先手动配置弹性云服务器,安装对应的驱动,然后再变更规格。否则,规格变更后的弹性云