检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
1、开启工具的动态校验功能,减少校验时间 应用启动 1~30 1、统一运维平台,批量关停,减少操作时间 2、统一日志平台,减少应用日志检查时间 中间件层停服(消息消费完) 5~30 1、提前关停非核心业务,减少消息量 2、统一监控平台,减少检查时间 - - - 应用测试 15~60 1、测试用例自动化 2、只测试核心测试用例
余数据进行恢复,确保数据的可用性和完整性。 自动故障恢复:设置自动化故障转移机制,在一个AZ发生故障时,自动将应用程序切换到其他可用的AZ上,以快速恢复服务,企业可以利用容器编排工具、自动化脚本或云服务提供商提供的故障转移功能来实现自动故障恢复。 监控和警报:设置监控和报警机制,
组织分级分域管理 组织分级分域管理是一种在现代企业治理中至关重要的方法,特别是在云计算环境下,随着业务的扩展和多样性的发展,这种管理方式变得越来越重要。您可以按照业务架构的不同层次和领域,基于华为云Organizations服务构建一个清晰、有序、易于管理的云上组织架构,然后将企
停服操作需考虑系统的可用性机制,部分系统检测到应用停止会有自动拉起功能,所以需先关闭可用性机制,防止出现应用一直无法停止的风险。 数据库切换时需要考虑数据一致性问题,要想切换前后数据一致,必须源端的数据先静止,然后断开增量同步任务,数据一致性对比方案需详细规划,是做行数对比还是做内
响应时间:包括平均响应时间、最小响应时间、最大响应时间、时间百分比等,其中时间百分比参考意义较大,如前95%的请求的最大响应时间。 并发量:同时处理的查询请求的数量。 成功率:指请求在一定时间内成功返回结果的比例。 华为云RDS提供了数据库的TPS/QPS等标准性能基线,企业也可以基于自己的业务数据重新进行压力测
地域级自然灾害的时候都能保护数据和业务。 RPO 时间取决于数据库复制间隔; 由于容灾站点一直运行,RTO 依赖容灾切换时间,通常取决于 DNS 缓存刷新时间,一般为分钟级,如果采用 GSLB 自动探测切换可进一步降低故障恢复时间。 图1 三AZ高可用设计 设计要点: 生产数据中心和容灾中心分别部署在华为云
设施(例如虚拟机规格信息,CPU,内存利用率性能数据,网络拓扑数据等),并提供其迁移到华为云的推荐配置以及主机的一站式迁移能力。 主机迁移服务(SMS):是一种P2V/V2V迁移服务,可以把X86物理服务器或者私有云、公有云平台上的虚拟机迁移到华为云弹性云服务器云主机上,具体使用方法请查看SMS帮助文档。
人员和场地准备 核对参与切换人员,并通知,包括内部人员和第三方配合人员通知和时间核对。 建立切换保障群,切换期间在保障群里进行切换相关公告和通知。 确定切换的具体日期、入场签到时间、操作开始时间。 切换场地的准备,如预约会议室,准备相关的物料(电脑、插排、投屏等)。 工具、终
RabbitMQ RocketMQ ActiveMQ 切换时间窗充足 切换时间充足,业务评估在切换时间窗口内可以完成消息消费,此时,消息中间件中的数据不需要迁移,等待消费者将消息消费完成即可 切换时间窗有限 切换时间有限,业务评估在切换时间窗口内无法完成消息消费,请参考消息中间件迁移方案进行消息迁移
实现双AZ的负载均衡;单点业务ECS可通过 SDRS 作AZ级容灾。 云服务高可用:主备节点分别双AZ部署。 数据库同步:云上使用RDS数据库服务,进行跨AZ主备部署,跨AZ间数据同步。 灾难恢复切换:当AZ发生故障时,RDS 数据库等自动切换至备库,应用层自动或者通过 SDRS 的一键容灾切换功能切换至其他AZ。
及某个步骤执行时间过长等问题,可以通过演练复盘优化Runbook步骤和时长,提高正式切换步骤的正确性和合理性,提高切换效率。 预估正式切换时长:通过演练,记录每个执行步骤的开始时间、结束时间和执行时长,可以更加准确地预估正式切换的时长,从而合理规划对外停机公告时间,协调周边团队的配合时间。
利用SMS主机迁移。如果源端是在ECS上自建数据库,需要将自建ECS数据库服务器迁移到华为云弹性主机ECS上,SMS可以帮助轻松实现,但是此时会中断数据库业务,需要注意。但是当对停机时间有较高要求,您也可以使用数据库的备份恢复功能或者数据库同步复制技术进行迁移。 使用备份恢复进
公共服务管理 首先您要识别出各个业务单元所需要的公共IT服务和资源,比如NTP服务器、SFS文件存储、自建DNS服务器、OBS桶、虚拟机镜像、证书等,也可以是CodeArts等PaaS服务。然后集中部署和维护这些公共IT服务,将其共享给公司内所有业务单元。华为云提供了三种资源共享的方式。
场景,我们建议使用CI/CD流水线构建自动化平台,然后在云上重新部署应用。 SMS工具迁移:是一种P2V/V2V迁移服务,可以帮您把X86物理服务器或者私有云、公有云平台上的虚拟机迁移到华为云弹性云服务器上,从而帮助您轻松地把服务器上的应用和数据迁移到华为云,主机迁移服务工作原理如下图所示:
具备数据库备份与恢复、主从同步、分布式架构的运维经验。 熟悉数据库安全策略和数据加密技术。 IT部门 自动化工程师 开发和维护自动化运维工具,提升运维效率。 实现云资源的自动化部署、监控和扩展。 编写脚本或代码实现日常运维任务的自动化。 推动智能化运维技术的应用,如AIOps。 熟悉自动化工具(如
Objective)。 故障自动化处理:云平台具备自动检测故障和自动恢复的能力,减少人为干预,缩短故障处理时间。 提升扩展性 扩展性指一个系统在面对不断增加的工作负载或请求时,在不改变系统架构或对现有系统进行最小修改的情况下,通过添加或调整资源(例如服务器、存储、带宽)而保持性能稳
考源端策略配置目标端ELB负载均衡策略,具体部署流程,请参照华为云弹性负载服务ELB。 迁移到ECS上部署的软件负载均衡:如果源端是服务器上自建的负载均衡,迁移到华为云上仍然采用ECS自建负载均衡的场景,也可以使用SMS工具迁移。 VPN VPN需要在目标端华为云重新部署,具体部署流程请参照华为云虚拟专用网络VPN。
实例(需先迁到云服务再迁移到自建) mysqldump导出导入 全量迁移 不依赖网络,操作较为复杂,只能全量迁移,不支持增量数据同步 停服时间窗较长场景 主从复制replication 全量+增量迁移 操作复杂 仅适用于源端和目标端均为自建MySQL数据库,由于源端和目的端版本不
稳定性。如果发现问题或异常,需要进行适当的调整和修复。 定期同步增量作业 在历史作业成功迁移并通过调测后,开始进行增量作业的迁移和同步。增量作业是指在迁移过程中新增的、需要定期运行的作业。 作业双跑 在增量作业迁移和同步成功后,进行作业双跑。作业双跑是指在新的大数据平台上同时运行
MySQL采用主备部署方式,主备实例之间的数据实时同步,如果主实例出现故障,备实例可以快速升为主实例; Redis、Kafka、CSS云搜索、RDS for MySQL都支持把数据备份到OBS桶,应对数据误操作之后的风险; 云主机/云硬盘可通过CBR云备份服务实现整个云主机或者云硬盘的备份。 父主题: