检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Runbook设计原则 Runbook是上云迁移过程中一个非常重要的文档,用于指导切换当天多人协同进行切换操作,规定了业务切换的流程和详细步骤。Runbook主要包括两部分,Runbook checklist和Runbook操作步骤,下面将从几个方面详细介绍如何设计切换Runbook。
Runbook角色设计 Runbook通常涉及如下角色,职责如下: 表1 Runbook角色与职责 角色 职责 操作人 按Runbook执行相应的操作步骤,并负责操作异常问题处理 确认人 确认操作人的操作步骤是否正常执行完成,并向引导人反馈执行结果,如遇异常,需要按Runbook约定要求,定期向引导人员同步处理进展。
概述 企业云化转型是一项复杂和系统的工程,涉及组织和流程、平台和架构、运维和管理等多个层面。如同建造摩天大楼,在挖地基之前就需要设计蓝图,企业在构建云基础设施和将业务系统上云之前,也需要进行全面而清晰的顶层规划。只有在充分的规划和准备下,才能最大程度地发挥云的优势,实现业务价值的最大化。
Runbook操作步骤设计 Runbook中的每一步操作,都有明确的操作步骤、操作命令/脚本、串/并行标记、操作人、确认人、预估开始时间、结束时间、预估执行时长。切换方案不同,对应的Runbook的操作步骤也不同。切换方案可以分停服切换和不停服切换。不停服切换方案对应用架构的要求
如何识别驱动力 识别驱动力是云化转型的前提,决定了组织是否有正当的理由开启云化转型。识别驱动力是一个比较复杂的过程,需要综合考虑企业的业务战略、业务需求、财务需求和技术需求,并要与高层和干系人达成一致。以下是推荐的步骤: 响应关键业务事件 企业高层的云化转型决策通常源于实际业务需
如何选择试点应用 试点应用的选择应该站在整体角度综合考虑是否满足优先试点的条件,选择试点应用时可以考虑如下因素: 上云意愿:企业推行全面上云时,不同业务部门的上云意愿是不一样的,可以优先考虑意愿度高、有充足的人力和时间、投入积极的业务。 业务重要性:根据企业现有的应用和业务,选择
Runbook Checklist设计 Runbook Checklist记录了正式切换前需要准备和执行的操作,通常包括如下几个方面: 人员和场地准备 核对参与切换人员,并通知,包括内部人员和第三方配合人员通知和时间核对。 建立切换保障群,切换期间在保障群里进行切换相关公告和通知。
Runbook参考模板 Runbook Checklist参考 表1 Runbook Checklist参考样例 大类 前置工作项 责任部门 活动 是否涉及 是否完成 计划完成时间 责任人 组织和保障准备 - 项目经理 - 是 - - - - 项目经理 - 是 - - - 第三方/业态
概述 应用系统迁移或部署到云上后,云化转型正式进入了运维治理阶段。这一阶段至关重要,因为它直接影响着云上IT基础设施和业务系统的性能、可靠性、安全性和成本效益。通过持续和有效的运维治理,企业能够确保云资源的高效利用,保障业务的连续性和稳定性,实现对云环境的全面掌控,最大化云化转型的收益。
概述 云上架构设计包括基础环境设计、应用部署架构设计、大数据架构设计三部分,如下图所示: 图1 云上架构设计总图 基础环境设计:企业上云首先要准备好基础环境,基础环境构建好以后,上云工作才能正式开始。基础环境在业界也叫做LandingZone(着陆区),基础环境设计包括6个方面,
财务驱动力 云化转型带来了大量的财务收益,包括按需付费,降低成本和新增收入等,对CFO和财务主管极具吸引力。 降低成本 传统模式(自建数据中心)下企业按照预测的业务峰值需求提前采购硬件和软件等IT资源,为了避免在高峰期出现性能瓶颈或服务中断,通常会过度采购资源。但实际业务负载具有
概述 企业上云通常先进行试点,试点完以后才进入大规模的上云迁移阶段。大规模上云阶段有两种上云形态: 分批迁移:对于能分批迁移的,企业通常会将大规模迁移划分为多个批次进行。大规模迁移的执行主要是按照批次规划逐批次进行迁移,如下图: 图1 分批迁移 整体迁移:对于不能分批的,应用的关
目标读者 如整体框架所述,CAF的内容涵盖云化全旅程和云化全视角,涉及到了组织内不同部门的不同角色,以下角色能从CAF中找到跟自身职责相关的指导,这些角色可以将这些指导作为决策和行动的起点。 CXO(包含CEO、CIO、CTO、COO、CFO等) 业务主管 IT主管、技术主管 财务专家
停写不停读切换方案 停写不停读,主要指切换期间,为了追求较好的用户体验,保持一部分读的服务不停服,保持在线可使用状态;为了保持数据一致性,写的服务仍然采用停服方式进行切换。从业务对外体验上,多数用户感知不到停服的影响,比如某购物平台,用户仍然可以浏览商品,但是不能下单,下单时可友
多云战略的驱动力 当前多云战略正在成为一种主流趋势,越来越多的组织选择将业务系统部署在多个云服务商的云平台上,而不是依赖单一的云服务商。这种趋势的背后是多种因素的驱动,以下是一些主要的驱动力: 避免单云故障:将业务部署在单一云平台上存在单点故障风险。如果该云平台出现故障,例如大规
调研方式 调研方法有很多,企业要结合自身的实际情况,从调研的效率、调研获取信息的完整度和真实度三个方面评估,选择最合适的调研方式。通常情况下,优先推荐CMDB调研法,CMDB中缺少的信息再通过云管平台或调研访谈的方式补齐。 如下是常见的调研方式,建议企业遵循由易到难的调研思路进行
概述 根据Flexera在2024年发布的《State of the Cloud Report》报告显示,管理云成本成为企业用云的头号挑战,企业的的云成本平均超过预算15%,平均有27%的公有云成本是浪费的,51%的企业已经成立了专门的FinOps团队,另外有20%的企业计划在未来一年成立FinOps团队。
概述 为什么要做批次规划 上云迁移批次规划是为了把上云迁移分成几个阶段,以便更加有效地迁移企业应用到云端。批次规划的目的是为了将上云迁移的复杂性减少到最低,以便更有效地安排上云迁移的时间,统筹资源,并分析各个迁移阶段的风险,让企业在最短的时间内完成上云迁移。 批次规划是企业上云迁
验证 数据校验 数据库的对比方法有数据库内容对比、对象对比、行数对比,文件的对比方法有文件数量对比,大小对比,内容对比。具体的数据对比的方法请参考章节数据验证的内容。 任务验证 大数据任务迁移后,要确保作业能够正常运行、产生准确的结果,并且满足性能要求。一般从如下三方面验证: 验证作业执行的成功率
概述 安全防护三分在于技术,七分在于运营。安全运营是指在云计算环境中,通过持续监控、检测、响应和改进,确保云资源、数据和应用的安全性。这种方法强调安全防护是一个持续的过程,而不是一次性的任务。只有通过持续的、有效的安全运营才能将多道安全防线有效协同起来,共同保障业务系统的安全稳定