检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
P2定义:其他补充用例,如切换时间窗足够,可切换当晚测试,如果切换时间窗不够,可第二天测试。 表3 测试用例执行说明 阶段 测试用例 覆盖率 切换前测试 所有 包括所有的应用功能和第三方集成功能测试。特殊无法测试场景需单独讨论模拟测试方案。 切换期间测试 分P0、P1、P2三个级别。 在切换时间窗内至少完成P0和P1级用例测试。
系,还需要考虑外部关联关系。内部关联关系主要用于迁移批次规划和制定切换方案,外部关联关系主要用于评估业务影响,选择合适的停机窗口和制定切换方案。 图1 关联关系调研图 调研内部关联关系 关联关系分析是批次规划和切换方案的重要输入,也是上云迁移的难点,影响上云迁移的关联关系主要有三种,如下图:
考虑继续采用自建的方案。 最小改造原则:如无特别的业务驱动,要尽量避免进行大规模改造。大数据任务调度平台的组件要1:1对标设计,版本尽量不变更,有版本升级需求的需要评估适配改造工作量。 弹性和可扩展性:在云上部署大数据任务调度平台时,应考虑平台的弹性和可扩展性。云环境提供了弹性计
它强调实践DevOps、基础设施即代码、自动化部署、测试验证和自动化运维任务,建立全面的监控、日志记录和告警机制。通过精心设计的操作流程、变更管理和持续改进方法,企业能够快速响应变化,减少错误,提升团队协作效率,确保业务目标的实现。 关于华为云Well-Architected F
干网实现降低时延的效果。 低并发、大流量基础四/七层负载分发场景建议选择共享型ELB并开启性能保障模式(支持5万并发),购买两个实例、通过域名解析分流可获得更大的并发支持。 超过10万并发、要求全链路HTTPS或高级转发策略支持的场景,建议选择独享型ELB。 ECS需要访问公网时
希望切换期间部分浏览类的业务继续提供服务,只是涉及写操作的业务受到影响。设计切换方案时,对于不同的业务场景和停服要求,会面临多种方案的选择,下面详细介绍如何合适的切换方案。 业务系统从源端切换到目的端,切换方案可以分为3类,即停服切换、停写不停读切换和不停服切换。每类切换方案优缺点具体如下表:
Checklist记录了正式切换前需要准备和执行的操作,通常包括如下几个方面: 人员和场地准备 核对参与切换人员,并通知,包括内部人员和第三方配合人员通知和时间核对。 建立切换保障群,切换期间在保障群里进行切换相关公告和通知。 确定切换的具体日期、入场签到时间、操作开始时间。 切换场地的准备,如
企业的管理重点转向更高层次的操作,如应用程序的性能优化、数据管理和云安全。 敏捷性 硬件采购和部署周期较长,资源扩展需要经过复杂的审批和采购流程,响应速度较慢。 创新和变更受到硬件资源的限制,难以快速适应业务需求的变化。 云资源可以按需动态扩展或缩减,企业可以快速响应业务需求的变化。 部署新应用或功能的速度显著提高,支持敏捷开发和持续交付。
于指导切换当天多人协同进行切换操作,规定了业务切换的流程和详细步骤。Runbook主要包括两部分,Runbook checklist和Runbook操作步骤,下面将从几个方面详细介绍如何设计切换Runbook。 Runbook设计原则如下: 一个Runbook对应一次切换操作。
值。这种反模式的具体例子如下: 集中化运营模式用于快速变化的业务:如果企业业务需要快速响应市场变化,但采用了集中化运营模式,所有资源申请和变更都需要CCoE团队审批,就会导致流程缓慢,错失商机。 去中心化运营模式用于需要高度合规性的业务: 如果企业的业务系统相对成熟稳定,对安全性
微服务。选择适合您的需求的服务注册与发现工具(如Consul、Eureka等),并确保在整个服务生命周期中能够有效地管理、监控和维护微服务。服务注册与发现工具可以帮助您自动化服务的注册和发现过程,并提供服务的健康状态检查和负载均衡等功能。 此外,还应该考虑负载均衡、故障恢复和服务
资源。 流量型资源的公共成本按用量拆分:使用成本中心的共同成本分拆能力,可将CDN、Live等团队共享使用的云资源成本,按照实际用量分摊到域名或IP。 容器集群成本拆分:华为云提供CCE成本洞察,开通后可将CCE集群相关的CCE集群管理费、CCE集群关联的ECS和EVS资源费用拆分到集群、命名空间和工作负载。
调研应用上云需求 调研内容包括当前应用上云的需求和约束条件: 迁移时间窗 切换时间窗 目标架构的要求(功能、性能、可用性、安全、成本、可扩展性、可运维性) 回退要求 业务的关联关系确认。 调研方式包括人工访谈或Workshop头脑风暴,可以与前面2项调研内容合并调研,减少调研次数。
由决策组负责人牵头对“决策点”进行决策 会务组 负责维护现场秩序,提供切换期间的会务保障。 每一行执行步骤都对应一个操作人和一个确认人(如涉及多人确认的情况,可以通过共享文档由多个分项确认人在线刷新确认进展)。 引导人通常是1~2个,是整个切换的总指挥(对于大规模切换,参与人员多,操作时间长的场景,也可以设计
实现跨区复制。 生产站点某个AZ故障时,切换到另一个AZ,数据库主备切换。 生产站点全体故障时,切换数据库的主备状态,然后将 DNS 授权修改为容灾站点(生产站点 0%,容灾站点为 100%)。 生产站点修复后,数据库切换回主库,DNS 切换回主站点(生产站点 100%,容灾站点为
同步数据 所有 消息中间件迁移方案 确定消息中间件的切换场景 表3 消息中间件切换场景 适用产品 切换窗口 迁移方式 Kafka RabbitMQ RocketMQ ActiveMQ 切换时间窗充足 切换时间充足,业务评估在切换时间窗口内可以完成消息消费,此时,消息中间件中的数据
M、漏洞管理服务CodeArts Inspector 运维监控账号 统一监控和运维各个成员账号下的资源和应用,统一进行告警管理、事件处理和变更管理,并提供运维安全保障措施 运维团队 应用运维管理AOM、COC、云日志服务LTS、应用性能管理APM、云堡垒机CBH等 日志账号 集中
的效率和准确性。 未进行切换演练 该反模式是企业未进行充分的切换演练,导致在正式业务切换时出现问题。 优化建议:在正式切换前进行全面的切换演练,模拟真实环境中的不同场景,及时发现并解决问题,确保系统在切换后能正常运行。 测试不充分 该反模式是指业务系统切换前测试不充分,导致潜在问
规格选型,输出详细的迁移方案和切换方案。 部署:创建云上资源,上云适配改造(如涉及),并做目标环境测试。 迁移:将源端应用和数据迁移到云上目标环境。 验证:进行数据和业务验证。 切换:进行切换演练,刷新Runbook,实施正式切换。 保障:业务切换后进行一段时间的实时监控和特别运维保障。
数据库同步:云上使用RDS数据库服务,进行跨AZ主备部署,跨AZ间数据同步。 灾难恢复切换:当AZ发生故障时,RDS 数据库等自动切换至备库,应用层自动或者通过 SDRS 的一键容灾切换功能切换至其他AZ。 容灾演练:通过应用切换或 SDRS 提供的容灾演练功能进行一键演练。 进行双AZ高可用设计