检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Runbook操作步骤设计 Runbook中的每一步操作,都有明确的操作步骤、操作命令/脚本、串/并行标记、操作人、确认人、预估开始时间、结束时间、预估执行时长。切换方案不同,对应的Runbook的操作步骤也不同。切换方案可以分停服切换和不停服切换。
应用系统调研 调研应用全景图 调研应用部署架构 调研应用关联关系 调研应用上云需求 父主题: 调研评估
概述 当企业上云规模逐渐变大,在云上有数十上百个应用系统和海量云资源,包括企业自有员工、外包员工及合作伙伴的员工在内的大量用户需要访问和操作这些云资源,量变导致质变,资源闲置、误操作、恶意操作、数据泄露和权限错配等风险将随着用云规模呈现指数级增长。
传统模式下,组织通常需要购买、安装和运维自己的硬件和软件,包括服务器设备、存储设备、网络设备、虚拟化软件、操作系统、数据库管理软件和中间件等IT基础设施,资源部署周期长,运维负担重,初始投资大。
迁移后的主机操作系统、系统配置,数据文件与源端服务器完全一致。关于主机迁移服务的更多详细信息,请参考IMS帮助文档。 容器迁移 容器是操作系统内核自带能力,是基于Linux内核实现的轻量级高性能资源隔离机制。
详细操作指导请参考官网文档。 MRS HDFS数据迁移到OBS CDM支持将MRS HDFS的数据迁移到OBS,详细操作指导请参考官网文档。
表2 容器迁移方案 迁移方案 特点 适用场景 CI/CD重新发布(推荐) 操作简单,配置可控 源端具备CI/CD流水线 容器镜像迁移 人工操作,工作量大 所有 容器迁移工具(Velero或E-Backup) 操作简单,可快速还原源端配置 所有 主机上的应用容器化上云 对于部署在主机上的传统应用
通过自动化工具和流程,可以减少手动操作、降低错误风险,并提高效率。例如,使用持续集成和持续交付(CI/CD)工具来自动构建、测试和部署应用程序。 基础设施即代码(IaC):采用基础设施即代码的方法可以将基础设施配置和管理纳入代码库中。
细粒度操作:将云资源的读、写、列表等操作进一步细化,对其细化操作进行鉴权,并将这些细化操作变成可供用户配置的权限操作。
操作较少。
这些应用系统的全面云化转型将导致在云上同时存在数百个业务系统和海量云资源,而且包括企业自有员工、外包员工及合作伙伴的员工在内的大量用户需要访问和操作这些云资源,量变导致质变,资源闲置、误操作、恶意操作、数据泄露和权限错配等风险将随着用云规模呈现指数级增长。
减少正式切换的中断时间:通常一个大型系统的切换要200多个步骤,中间有并行操作和串行操作交叉进行,涉及角色和人员也较多,可以通过一次或多次演练,提高切换操作的熟悉度和各方的配合默契度以及问题处理的效率,对于一些操作时长比较长的步骤,还可以通过自动化脚本代替人工操作或者持续优化脚本提高执行效率
出问题会直接影响企业业务,不同业务对停服的要求是不一样的,比如,有些业务在切换期间是不允许停服的,停服会造成较大的业务损失;有些业务在切换期间是允许停服的,比如办公OA系统,夜间非工作期间可以停服;有些业务系统,为了更好的客户体验,希望切换期间部分浏览类的业务继续提供服务,只是涉及写操作的业务受到影响
业务可用性目标的达成是一项系统工程,公有云模式下,业务的可靠性取决于客户对整体业务架构的可用性设计、运维规范管理(如:备份机制、日常演练、人员操作规范等)。
表1 云运维团队的角色和职责 角色 职责 技能要求 来源 云基础设施管理员 负责云平台上存储、虚拟机、操作系统等基础设施的日常运维管理。 监控和优化云资源的使用效率,确保资源分配合理。 处理虚拟机、存储和操作系统相关的故障,保障系统的高可用性。 定期进行系统补丁更新和安全加固。
Runbook要细化到每个执行命令,尽量脚本化或工具化,操作人直接执行即可,不需要现场临时定制,避免出现人为事故。 Runbook步骤中有并行操作和串行操作,要标记好串并行顺序,避免人为操作不当影响切换时长和切换结果。
Runbook角色设计 Runbook通常涉及如下角色,职责如下: 表1 Runbook角色与职责 角色 职责 操作人 按Runbook执行相应的操作步骤,并负责操作异常问题处理 确认人 确认操作人的操作步骤是否正常执行完成,并向引导人反馈执行结果,如遇异常,需要按Runbook约定要求
熟悉各种操作系统和应用软件。 具备扎实的脚本编写能力(例如Shell、Python等),能够实现自动化操作。 具备良好的沟通和团队协作能力。 IT部门或者外包给云实施专业服务提供商 父主题: 云卓越中心
根据最新的应用清单和JOB任务清单,刷新Runbook中相关的切换操作脚本。 环境检查 切换前需确保源端、目的端、迁移任务状态正常,执行脚本准备就绪。
表2 主机信息调研表示例 主机名 主机类型 (ECS/物理机) 规格 CPU (core) 内存(GB) 操作系统版本 系统盘类型 系统盘大小(G) 数据盘类型 数据盘大小(G) 私网IP 公网IP 此处仅给出表头信息作为参考。 表格具体内容请按业务实际情况进行补充。