华为云用户手册

  • 包年/包月到期转按需计费(按带宽计费) 进入共享带宽列表页面。 在共享带宽列表中,支持操作单个共享带宽或者批量操作多个共享带宽,请您根据需要选择以下指导,将包年/包月的共享带宽转为按需计费(按带宽计费)的共享带宽: 单个共享带宽: 单击目标共享带宽所在行的操作列下的“更多”,选择“到期转按需”。 多个共享带宽: 勾选多个共享带宽,在列表左上方,单击“到期转按需”。 在确认弹窗中,确认无误后,单击“是”。 在“费用中心”的“到期转按需”页面,确认IP信息,单击“到期转按需”。
  • 包年/包月即时转按需计费(按带宽计费) 进入共享带宽列表页面。 在共享带宽列表中,支持操作单个共享带宽或者批量操作多个共享带宽,请您根据需要选择以下指导,将包年/包月的共享带宽转为按需计费(按带宽计费)的共享带宽: 单个共享带宽: 单击目标共享带宽所在行的操作列下的“更多”,选择“即时转按需”。 多个共享带宽: 勾选多个共享带宽,在列表左上方,单击“即时转按需”。 在确认弹窗中,确认无误后,单击“是”。 在“费用中心”的“包年/包月转按需”页面,确认费用信息无误后,单击“转按需”,完成修改。 包年/包月即时转按需会退还当前周期的剩余费用,订单完成后,按需的计费模式立即生效,具体计费规则请参见包年/包月即时转按需。
  • 在费用中心续费 登录管理控制台。 单击“控制台”页面上方“费用”,在下拉菜单中选择“续费管理”。 进入“续费管理”页面。 自定义查询条件。 可在“手动续费项”、“自动续费项”、“到期转按需项”、“到期不续费项”页签查询待续费资源,对资源进行手动续费的操作。 所有需手动续费的资源都可归置到“手动续费项”页签,具体操作请参见如何恢复为手动续费。 手动续费资源。 单个续费:在资源页面找到需要续费的资源,单击操作列的“续费”。 批量续费:在资源页面勾选需要续费的资源,单击列表左上角的“批量续费”。 选择弹性公网IP的续费时长,判断是否勾选“统一到期日”,将弹性公网IP到期时间统一到各个月的某一天(详细介绍请参见统一包年/包月资源的到期日)。确认配置费用后单击“去支付”。 进入支付页面,选择支付方式,确认付款,支付订单后即可完成续费。
  • 功能总览 表1列出了弹性公网IP的常用功能。 表1 弹性公网IP常用功能 功能分类 功能名称 功能描述 弹性公网IP和带宽 弹性公网IP 弹性公网IP提供独立的公网IP资源,包括公网IP地址与公网出口带宽服务,可以与云资源灵活绑定及解绑。 华为云提供的弹性公网IP相关功能包括:为云资源申请和绑定弹性公网IP、解绑和释放云资源的弹性公网IP、修改弹性公网IP带宽、静态BGP转换为动态BGP。 详细内容,请参见弹性公网IP简介。 共享带宽 共享带宽可以实现多个弹性公网IP共同使用一条带宽。提供区域级别的带宽共享及复用能力,同一区域下的所有已绑定弹性公网IP的弹性云服务器、裸金属服务器、弹性负载均衡等实例共用一条带宽资源。 华为云提供的共享带宽相关功能包括:申请共享带宽、修改共享带宽、删除共享带宽、添加弹性公网IP到共享带宽、从共享带宽中移出弹性公网IP。 详细内容,请参见共享带宽简介。 共享流量包 共享流量包是一款带宽流量套餐产品,使用方便,价格实惠。购买共享流量包后立即生效,并自动抵扣按需计费(按流量计费)的EIP带宽产生的流量资费,直到流量包用完或到期。 详细内容,请参见共享流量包简介。 带宽加油包 带宽加油包用来临时调大带宽上限,适用于在有效期内的包年/包月独享带宽和共享带宽。 华为云提供的带宽加油包相关功能包括:购买带宽加油包、修改带宽加油包和退订带宽加油包。 详细内容,请参见带宽加油包简介。 监控 查看监控指标 当用户开通了虚拟私有云服务后,无需额外安装其他插件,即可在 云监控 查看带宽、弹性公网IP的使用情况,也可以创建和设置告警规则,自定义监控目标与通知策略,及时了解虚拟私有云的状况,从而起到预警作用。 详细内容,请参见支持的监控指标。 标签 标签管理 标签功能方便您识别和管理云资源。华为云支持管理虚拟私有云标签、管理子网标签和管理弹性公网IP标签。 权限 权限管理 您可以使用 统一身份认证 服务 IAM 对您所拥有的弹性公网IP进行精细的权限管理,以满足企业基于组织划分、职能划分设置不同的访问权限。 说明: 弹性公网IP的权限包含在虚拟私有云中,由虚拟私有云的权限进行统一访问权限管理。 华为云提供的虚拟私有云权限管理功能包括:创建用户并授权使用VPC、创建VPC自定义策略。 详细内容,请参见权限管理。
  • 产品使用约束 使用前应规划好云上VPC和本地IDC的网段,需保证云上VPC网段和本地IDC网段不会重叠。 VPC内云服务地址网段100.64.0.0/10、127.0.0.0/8、169.254.0.0/16、224.0.0.0/3 为VPC保留网段,请勿使用以上网段作为云专线的远端子网。 为您提供端口规格是1G和10G并且传输距离为10公里的光模块,超过10公里的光模块或者购买端口规格是40G和100G端口均需自行购买光模块。 如果您需要从专线访问ELB,请您使用ELB源IP负载均衡算法代替ELB会话保持功能。 云专线默认不支持对接企业交换机(ESW),如果您需要从专线访问ESW,请您提交工单开通ESW对接功能。 云专线只支持回应Ping探测的普通ICMP报文(type=8、code=0的echo报文且不携带ip option),不支持回应其余类型的ICMP报文。 云专线对物理连接端口接收到的本端网关IP的Ping探测限速为30次/秒。 如果您需要通过企业路由器绕行实现IDC之间互访,需要保证两个IDC接入不同的设备,详情请提交工单咨询。 一个虚拟网关仅支持关联两个不同的设备,不能关联更多。
  • 施工规则 施工方进入机房施工时,请遵守机房运营商和工程师向您展示的施工规定,如果施工方不遵守机房规定,将无法完成施工。 机房不支持托管任何光电转换设备,施工方携带的任何光电设备无法安装到机房。 政策封网或华为云管理封网都将影响专线延时施工,如果遇到华为云封网,请向您的专线经理咨询。 接入点机房是电信运营商或第三方租赁的机房,如果存在专线入楼费和楼内线缆费,需接入方向机房运营商支付。 接入点机房是电信运营商或第三方数据中心运营,进入机房施工需提供机房专线接入授权书,请在施工前完成授权书申请。
  • PO机会点主要验证哪些环节? ①重复处理原则: HO以Cloud CRM创建机会点的时间点为准,PO以机会点审核通过的时间点为准,时间更早的为准。应避免PO与HO重复,或者PO与PO重复。 ②有效性处理原则:经过客户负责人与客户交流确认后,如果存在下述任何一个问题,则驳回机会点: 客户确认机会点不存在,或者已完成交易 → 驳回 客户没有预算,或没有明确的下单时间 → 驳回 客户需求与华为云无关,无法从客户侧或者伙伴侧获得华为云增量收入 → 驳回 父主题: 共享给华为(PO)
  • E CS 费用归集方式变更说明 为提升客户对账体验,弹性 云服务器ECS 费用归集方式于2023年8月1日进行了更新,更新内容如下,请您关注。 示例:您购买了一套ECS产品,包含:弹性云服务器、云硬盘、镜像、虚拟私有云。 变更前:弹性云服务器ECS的下属子资源如:云主机、系统盘、数据盘、镜像会分别出账,费用分别在弹性云服务器ECS、云硬盘EVS(系统盘+数据盘)、镜像IMS下呈现,分别为¥100.00、¥50.00、¥50.00。 变更后(包年/包月计费模式):弹性云服务器ECS的下属子资源如:云主机、系统盘、数据盘、镜像*会按照弹性云服务器服务出账,费用统一归集到弹性云服务器ECS下,为¥200.00。共享盘保持不变,费用仍归属到云硬盘EVS下,单独出账,为¥40.00。 变更后(按需计费模式):弹性云服务器ECS的下属子资源如:云主机、系统盘、镜像*会按照弹性云服务器服务出账,费用统一归集到弹性云服务器ECS下,为¥170.00。数据盘和共享盘保持不变,费用仍归属到云硬盘EVS下,分别为¥30.00和¥40.00。 说明: ① *处的镜像指华为云镜像,费用归集到弹性云服务器ECS产品类型下。云商店镜像仍会单独出账,费用归集到IMS产品类型下。下文中的镜像均指华为云镜像。 ②单独购买的云硬盘、镜像等服务则不受此影响,费用仍会汇总在云硬盘EVS、镜像IMS下。 父主题: 其他
  • 机会点重复处理原则? PCE机会点重复处理原则:当多个PO或者HO出现重复时,仅允许一个PCE机会点通过。 多个PO重复:原则上以“机会点验证通过”的提交时间点为准;伙伴提交的机会点状态为“机会点验证通过”后,不再接受其他伙伴提交的重复机会点。 PO和HO重复:HO以提交时间点为准,PO以 “机会点验证通过”的提交时间点为准,按照时间点优先判定机会点来源。 BD是处理“机会点重复”的第一责任人。 父主题: 共享给华为(PO)
  • 申请提现 线上充值:对于线上充值到华为云账户的款项,当签约主体变更后申请提现,系统会原路退回到相应的支付宝、微信、个人网银、企业网银等充值账户,即变更前充值支付的,会使用华为软件的银行账户退款,变更后充值支付的,会使用 华为云计算 的银行账户退款。 线下转账汇款:对于线下转账汇款到华为云账户的款项,当签约主体变更后申请提现,系统统一使用华为云计算的银行账户退款,有可能出现收退款账户不一致问题。 举例:充值时向华为云的银行账户(华为软件)线下打款10万,消费8万,签约主体变更后,伙伴申请余额提现2万,华为云使用新的银行账户(华为云计算)退款,收退款账户不一致。
  • 开具发票 场景一:签约主体变更后账户余额在后续消费时如何开票? 签约主体变更前未开过发票的余额部分,后续消费,由华为云计算开票; 签约主体变更前已开过发票的余额部分,后续消费,不再开票。 举例:账户余额100元,其中有20元之前已开票(欠票),80元未开票。签约主体变更后新下单消费90元,账户余额为10元,可开票金额为70元,20元不开票。70元由华为云计算开票 。 场景二:签约主体变更前已消费未开票的订单,签约主体变更后如何开票? 可以开票,由华为软件开票。 举例:已下单消费100元,一直未开票,可开票金额为100元。签约主体变更后,这笔消费可以继续申请开票,开票主体为华为软件。 场景三:退订、退款部分后续消费如何开票? 退订的订单未开过发票的退款部分,后续消费,由华为云计算开票; 退订的订单有开过发票的退款部分,后续消费,不再开票。 举例1:已下单消费100元,一直未开票。签约主体变更后,退订该笔订单,退款80元。重新下单消费 50元,可开票金额为50元,开票主体为华为云计算。 举例2:已下单消费100元,已开票。签约主体变更后,退订该笔订单且未退票,退款80元(欠票为80元),重新下单消费50元(欠票为30元)。
  • 伙伴提交商机(PO)时需要注意什么? 1)PO商机必须是伙伴已经投入足够的努力,包括客户会谈、需求对齐、方案讨论等活动,从客户侧获得的确定性项目需求,不能是公开招标、道听途说、简单猜想的客户需求,且面向的客户是华为云的已有客户或者潜在客户。 2) 伙伴提交的PO应当满足:客户有采购或获取华为可提供的产品/服务/解决方案的意愿或规划,已经有初步的投资计划或预算,客户非常有可能在一年或更短的时间内进行采购,或者正处于采购计划的初期阶段,如顶层设计、需求规划、准备标书等。一旦机会点验证完成后,就可以投入销售资源,期待将此机会点转化成交易。 3)在共享商机给华为之前,需要获取客户的相关授权,避免在未经客户同意的情况下将客户敏感商业秘密提供给华为。 父主题: 共享给华为(PO)
  • 伙伴要满足哪些条件才能收到华为云共享的商机(HO)? 伙伴想要获得华为云共享的HO,在成功加入合作伙伴共拓计划后,满足如下两个条件之一,则有机会获得华为云共享的机会点HO: 1)伙伴发展路径进入“差异化”阶段; 2)伙伴发展路径进入“已认证”阶段且近12个月内有3个已经签单且完成交付的PO。。 注意:由于合作伙伴共拓计划还处于推广阶段,在HO中对伙伴Offering的类型存在一定的限制,要求伙伴有基线解决方案或白名单联营商品后,才能将HO与伙伴方案建立关联。请留意最新的Offering类型要求。 父主题: 由华为共享(HO)
  • 事件单处理说明 事件单不同处理方式说明如表1所示。 表1 事件单处理类型说明 处理类型 说明 标记处理 标记事件单,标记处理后事件单状态会变为“待验证”,并走给提单人进行验证,验证操作如下: 验证通过:验证通过后事件单处理完成,事件单关闭。 验证不通过:重新走给处理人进行处理。 移交处理 将事件单移交给其他人处理。 退回申请 将事件单退回给提单人,提交人可以处理后重新提交。 暂停申请 将事件单暂停,暂停申请后事件单状态会变为“待暂停”,并走给提单人确认,确认操作如下: 同意暂停:事件单暂停。暂停后可以取消暂停,重新走给处理人进行处理。 不同意暂停:重新走给处理人进行处理。 关闭 关闭事件单。
  • 创建事件单 进入AppStage运维中心。 将鼠标悬停在右上角的账号,选择下拉列表中的“工单管理”,默认显示“变更单管理”页面。 单击左侧导航栏的“事件单管理”,进入“事件单管理”页面。 单击“新建”。 配置事件单参数,参数说明如表1所示。 表1 事件单参数说明 参数名称 参数说明 产品 选择产生事件的产品。 服务 选择产生事件的服务。 服务环境 选择产生事件的服务环境。 事件来源 选择事件来源,支持选择配置问题、版本问题、第三方问题、客户报障、告警、变更引入、其他。 事件级别 选择事件所属级别,级别分为P1~P5。 事件名称 输入事件名称。 处理人 选择事件的处理人。 可以参考事件排班表的值班人进行处理。 描述 输入事件的详细描述。 单击“提交”,提交事件单。 提交后事件会进入处理人的待处理事件列表中,并且会根据设置的通知方式通知处理人进行处理。
  • 更多操作 您还可以进行以下操作。 表2 相关操作 操作名称 操作步骤 管理扫描规则 VMS默认扫描华为公有云账号下的所有资源,可以禁用或者删除对应账号的扫描规则。 在“未纳管主机”页面,单击列表上方的“扫描规则”。 单击对应账号后的“编辑”,禁用该账号扫描规则;或者单击“删除”,删除该账号规则。 查看未纳管主机详情 在“未纳管主机”页面可以单击资源所在行后“详情”列的内容,查看资源部署参数详情。 导出未纳管主机 在“未纳管主机”页面,单击列表上方的“导出”,即可导出所有未纳管主机。 在“我的导出”页面,单击文件名下载并查看导出信息。 升级OpsAgent 在未纳管主机列表,勾选待升级OpsAgent的主机。 单击列表上方的“升级OpsAgent”。 选择需要升级的OpsAgent的版本。 单击“确定”。 卸载OpsAgent 在未纳管主机列表,勾选待卸载OpsAgent的主机。 单击列表上方的“卸载OpsAgent”。 单击“确定”。
  • 步骤二:安装OpsAgent 在“未纳管主机”页面,单击“部署OpsAgent”。 安装方式选择“远程安装”或“手动安装”。 手动安装:首次安装OpsAgent时,必须使用手动安装方式。 填写基本信息,OpsAgent基本信息参数说明如表1所示。 表1 OpsAgent基本信息参数说明 参数名称 参数说明 租户账号 选择租户账号,为租户VPC下的主机安装OpsAgent。 归属Region 选择租户VPC所属的Region。 OpsAgent版本 选择需要安装的OpsAgent的版本号。 VPC 选择 虚拟私有云VPC ,为该VPC下的主机安装OpsAgent。 说明: 可选VPC为已纳管VPC,如无可选VPC,请完成将VPC纳管至运维中心ENS打通网络。 接入方式 当前支持“直接接入(内网)”的接入方式,为华为云主机接入安装OpsAgent。 单击CURL命令或WGET命令后的,复制安装命令。 使用root账号远程登录主机后,执行安装命令安装OpsAgent。 安装完成后,未纳管主机列表中,该主机的OpsAgent状态为“在线”。 远程安装:选择虚拟私有云下已经安装了OpsAgent的主机作为安装机,安装机将作为中间桥梁安装OpsAgent到同虚拟私有云下的其他主机。 填写基本信息,OpsAgent基本信息参数说明如表1所示。 选择安装机,选择一台已安装OpsAgent的主机作为安装机。 添加主机,单击需要安装OpsAgent的主机所在行“操作”列的“编辑”,输入主机root密码后单击“确定”,然后在列表中勾选该主机。 单击“确定”,安装机将作为执行机为主机安装OpsAgent。 在“未纳管主机”页面,可以通过OpsAgent状态判断主机OpsAgent是否安装成功。 如果主机的OpsAgent状态为“在线”,表示已安装成功。 如果主机的OpsAgent状态为“失败”,表示未安装成功,可以在“OpsAgent任务”页面,查看安装任务日志。
  • 操作须知 将主机纳管至VMS,需要完成如下操作: 步骤一:刷新未纳管主机:首先需要刷新未纳管主机,将华为云其他主机同步至未纳管主机列表中。 步骤二:安装OpsAgent:纳管前需要为主机安装OpsAgent。 步骤三:分配主机:纳管主机需要将主机分配到对应的服务及环境下。 主机分配当天密码管理定时任务会自动修改主机账号的密码,密码有效期为90天,到期自动修改。如果不想密码被修改,需要在纳管主机前配置密码白名单规则。如果没有配置密码白名单规则,密码管理任务会检查密码有效期,并在密码过期前20天修改密码。
  • 采集Linux主机监控指标操作流程 采集Linux主机监控指标操作流程如图1所示。 图1 操作流程 创建监控模板:监控服务提供_OS_DEFAULT监控模板,同时可以创建其他监控模板,并用户可以在模板内添加需要使用的插件。 绑定监控模板:为主机绑定在模板管理中创建的监控模板,系统会根据插件采集主机的各项监控指标。可以按主机绑定监控模板,也可以对主机进行分组,按分组绑定监控模板。 查看虚机报表:监控指标数据采集后,可以在虚机报表中查看。
  • 日志接入场景 表1 日志接入场景说明 场景 说明 日志接入方式 虚拟机日志 日志存储在虚拟机下的文件路径中。 虚拟机日志接入 容器hostPath日志 主机文件系统上的文件或目录挂载到容器上,使用主机文件系统存储容器日志。 容器日志接入 容器标准输出日志 标准输出是Kubernetes社区推荐的日志输出方式。 虚拟机日志接入同时开启软连接 容器共享存储日志 容器日志挂载在共享存储上。 容器归属的虚拟机没有挂载此共享存储,则无法采集对应的容器日志,需要将共享存储挂载在虚拟机上。 将共享存储挂载在虚拟机上,然后使用虚拟机日志接入方式
  • 认识监控服务概览页 监控服务概览页如图1所示,展示近7天各级别告警数量、告警列表及关键事件列表等信息。 图1 监控服务概览 告警 - 近7天:展示近7天各级别告警数量。 告警列表 - 近7天:展示近7天严重和紧急级别的告警,可单击“更多”查看对应告警详情。 关键事件列表 - 近7天:展示近7天关键事件,可单击“更多”跳转至“事件列表”页面查看事件详情。 关键体验指标/黄金指标:展示关键体验指标/黄金指标,可以设置查询时间及查询粒度。 XXXX标准指标:展示各标准指标的监控数据,如负载均衡(SLB)标准指标、数据库治理(WiseDBA)标准指标、主机管理服务(VMS)标准指标等,如图2所示。 图2 VMS指标 父主题: 使用监控服务进行资源及业务监控
  • 使用限制 绑定监控模板进行主机监控,支持的主机的操作系统如表1所示,其余类型的主机无法绑定监控插件。 表1 监控服务支持的主机操作系统 操作系统 系统版本 EulerOS EulerOS2.5、EulerOS2.9 CentOS CentOS 7.2、CentOS 7.6、CentOS 7.8、CentOS 7.9、CentOS 8.2 Ubuntu Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 SUSE SUSE11、SUSE12、SUSE15、OpenSUSE 15.0
  • 接入后验证 纳管实例完成后即表示已将数据库接入至AppStage,在实例列表中会显示已纳管的数据库实例,可根据以下内容验证是否接入成功。 在实例列表中查看数据库实例的运行状态、规格与华为云是否一致。 单击实例名称进入实例详情页面,查看实例详细信息是否准确。 在实例列表,单击数据库实例所在行“操作”列的“账号”,单击“治理账号”,在治理账号列表查看是否已创建治理账号。 包括数据查询账号(dbquery)、SQL变更账号(change) 和性能分析账号(monitor)。 纳管后用户无法再持有明文密码,如果需要紧急修改数据库时,可以通过在数据库实例详情页面申请账号,获取账号密码。
  • 前提条件 已获取服务运维岗位权限和数据库DBA角色权限,权限申请操作请参见申请权限。 已设置执行机。 同VPC执行机:将待接入运维中心的数据库所在VPC下的主机设置为执行机。 跨VPC执行机:将待接入数据库的自有服务下所属其他VPC的主机设置为执行机。 数据库接入时系统会优先使用该数据库同VPC下的执行机,如果同VPC下没有执行机,随机选择服务关联的其他VPC下的执行机。跨VPC时,需保证执行机所在VPC与待接入运维中心的数据库所在VPC网络互通。请参见对等连接和安全组,连通服务关联的所有VPC,放通数据库和服务下所有执行机的安全组。
  • 操作流程 具体操作流程如图1所示。 图1 操作流程 配置服务环境 (可选)录入其他华为账号:如果需要将其他账号下的华为云资源接入至AppStage进行管理,可以将账号录入AppStage。 启用环境:创建并启用环境,并通过环境配置将服务与环境进行关联。 录入企业项目:AppStage平台申请对应服务华为账号下的资源时,需要获取租户的EPS。 资源接入运维中心 VPC接入:资源接入AppStage前需要先打通网络,通过纳管VPC实现VPC下资源的网络连通。 主机接入:AppStage运维中心支持纳管主机,对主机进行统一管理,包括主机资源发放/回收/操作、OS管理、密码密钥管理等。 数据库接入:AppStage运维中心支持纳管数据库,对数据库进行统一管理,包括数据库台账、自动化SQL变更、数据查询、自动化数据提取、性能分析、负载分析、数据库风险诊断等。 容器集群接入:AppStage运维中心支持纳管CCE容器集群,对CCE容器集群进行统一管理,包括资源池监控、访问安全控制、任务调度、业务负载弹性伸缩和多种K8s扩展等。 数据接入运维中心 虚拟机日志接入:支持通过部署filebeat完成虚拟机日志采集。日志接入后,可以对日志进行检索,查看已接入日志,具体操作请参见在监控服务查看已接入日志。 容器日志接入:支持将容器日志接入AppStage运维中心。日志接入后,可以对日志进行检索,查看已接入日志,具体操作请参见在监控服务查看已接入日志。 主机监控接入:支持定义服务的监控模板,然后通过为主机绑定监控模板,采集主机监控数据。 CES 指标接入:支持将 云监控服务 CES采集的监控指标数据接入至AppStage运维中心,如需将CES生成的告警接入AppStage运维中心,可参考CES告警接入操作。 监控运维数据 开发业务指标:对已产生或接入的数据进行指标开发。 开发业务报表:对已创建的指标或视图数据进行业务报表开发,配置后可以查看业务报表监控,具体操作请参见查看监控服务已开发的业务报表。 配置告警:支持对虚拟机监控数据或业务数据配置告警,及时掌握虚拟机状态,容器接入并安装监控插件后会自动生成告警。告警配置后可以查看告警,并及时处理告警问题,具体操作请参见查看并处理告警。
  • Cluster AutoScaler HPA是针对Pod级别的,但是如果集群的资源不够了,那就只能对节点进行扩容了。集群节点的弹性伸缩本来是一件非常麻烦的事情,但是好在现在的集群大多都是构建在云上,云上可以直接调用接口添加删除节点,这就使得集群节点弹性伸缩变得非常方便。 Cluster Autoscaler是Kubernetes提供的集群节点弹性伸缩组件,根据Pod调度状态及资源使用情况对集群的节点进行自动扩容缩容。由于要调用云上接口实现弹性伸缩,这就使得在不同环境上的实现与使用各不相同,这里不详细介绍。 CCE的集群节点弹性伸缩请参见创建节点伸缩策略。
  • HPA工作机制 HPA(Horizontal Pod Autoscaler)是用来控制Pod水平伸缩的控制器,HPA周期性检查Pod的度量数据,计算满足HPA资源所配置的目标数值所需的副本数量,进而调整目标资源(如Deployment)的replicas字段。 图1 HPA工作机制 HPA可以配置单个和多个度量指标,配置单个度量指标时,只需要对Pod的当前度量数据求和,除以期望目标值,然后向上取整,就能得到期望的副本数。例如有一个Deployment控制有3个Pod,每个Pod的CPU使用率是70%、50%、90%,而HPA中配置的期望值是50%,计算期望副本数=(70 + 50 + 90)/50 = 4.2,向上取整得到5,即期望副本数就是5。 如果是配置多个度量指标,则会分别计算单个度量指标的期望副本数量,然后取其中最大值,就是最终的期望副本数量。
  • Prometheus与Metrics Server 想要做到自动弹性伸缩,先决条件就是能感知到各种运行数据,例如集群节点、Pod、容器的CPU、内存使用率等等。而这些数据的监控能力Kubernetes也没有自己实现,而是通过其他项目来扩展Kubernetes的能力。 Prometheus是一套开源的系统监控报警框架,能够采集丰富的Metrics(度量数据),目前已经基本是Kubernetes的标准监控方案。 Metrics Server是Kubernetes集群范围资源使用数据的聚合器。Metrics Server从kubelet公开的Summary API中采集度量数据,能够收集包括了Pod、Node、容器、Service等主要Kubernetes核心资源的度量数据,且对外提供一套标准的API。 使用HPA(Horizontal Pod Autoscaler)配合Metrics Server可以实现基于CPU和内存的自动弹性伸缩,再配合Prometheus还可以实现自定义监控指标的自动弹性伸缩。
  • 使用HPA 下面通过示例演示HPA的使用。首先使用Nginx镜像创建一个4副本的Deployment。 $ kubectl get deploy NAME READY UP-TO-DATE AVAILABLE AGE nginx-deployment 4/4 4 4 77s $ kubectl get pods NAME READY STATUS RESTARTS AGE nginx-deployment-7cc6fd654c-5xzlt 1/1 Running 0 82s nginx-deployment-7cc6fd654c-cwjzg 1/1 Running 0 82s nginx-deployment-7cc6fd654c-dffkp 1/1 Running 0 82s nginx-deployment-7cc6fd654c-j7mp8 1/1 Running 0 82s 创建一个HPA,期望CPU的利用率为70%,副本数的范围是1-10。 apiVersion: autoscaling/v2 kind: HorizontalPodAutoscaler metadata: name: scale namespace: default spec: scaleTargetRef: # 目标资源 apiVersion: apps/v1 kind: Deployment name: nginx-deployment minReplicas: 1 # 目标资源的最小副本数量 maxReplicas: 10 # 目标资源的最大副本数量 metrics: # 度量指标,期望CPU的利用率为70% - type: Resource resource: name: cpu target: type: Utilization averageUtilization: 70 创建后HPA查看。 $ kubectl create -f hpa.yaml horizontalpodautoscaler.autoscaling/scale created $ kubectl get hpa NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE scale Deployment/nginx-deployment 0%/70% 1 10 4 18s 可以看到,TARGETS的期望值是70%,而实际是0%,这就意味着HPA会做出缩容动作,期望副本数量=(0+0+0+0)/70=0,但是由于最小副本数为1,所以Pod数量会调整为1。等待一段时间,可以看到Pod数量变为1。 $ kubectl get pods NAME READY STATUS RESTARTS AGE nginx-deployment-7cc6fd654c-5xzlt 1/1 Running 0 7m41s 查看HPA详情,可以在Events里面看到这样一条记录。这表示HPA在21秒前成功的执行了缩容动作,新的Pod数量为1,原因是所有度量数量都比目标值低。 $ kubectl describe hpa scale ... Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal SuccessfulRescale 21s horizontal-pod-autoscaler New size: 1; reason: All metrics below target 如果再查看Deployment的详情,可以在Events里面看到这样一条记录。这表示Deployment的副本数量被设置为1了,跟HPA中看到的一致。 $ kubectl describe deploy nginx-deployment ... Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal ScalingReplicaSet 7m deployment-controller Scaled up replica set nginx-deployment-7cc6fd654c to 4 Normal ScalingReplicaSet 1m deployment-controller Scaled down replica set nginx-deployment-7cc6fd654c to 1
  • CSI Kubernetes提供了CSI接口(Container Storage Interface,容器存储接口),基于CSI这套接口,可以开发定制出CSI插件,从而支持特定的存储,达到解耦的目的。例如在Namespace:资源分组中看到的kube-system命名空间下everest-csi-controller和everest-csi-driver就是CCE开发存储控制器和驱动。有了这些驱动就可以使用EVS、SFS、OBS存储。 $ kubectl get po --namespace=kube-system NAME READY STATUS RESTARTS AGE everest-csi-controller-6d796fb9c5-v22df 2/2 Running 0 9m11s everest-csi-driver-snzrr 1/1 Running 0 12m everest-csi-driver-ttj28 1/1 Running 0 12m everest-csi-driver-wtrk6 1/1 Running 0 12m
共100000条