检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Runbook是上云迁移过程中一个非常重要的文档,用于指导切换当天多人协同进行切换操作,规定了业务切换的流程和详细步骤。Runbook主要包括两部分,Runbook checklist和Runbook操作步骤,下面将从几个方面详细介绍如何设计切换Runbook。 Runbook设计原则如下:
统一监控和运维各个成员账号下的资源和应用,统一进行告警管理、事件处理和变更管理,并提供运维安全保障措施 运维团队 应用运维管理AOM、COC、云日志服务LTS、应用性能管理APM、云堡垒机CBH等 日志账号 集中存储和查看所有账号的审计日志和安全相关的日志(如VPC流日志和OBS访问日志等)
需根据表的重要性和切换时长综合考虑来确定数据一致性对比方案。 源端数据静止,除了停止应用外,还要考虑批处理任务和消息队列中的消息消费情况等。 应用和定时任务的启停经常有顺序,需梳理应用和批处理任务的启停顺序,避免启动顺序不当造成业务影响。 由于公网DNS的域名解析有缓存功能,所
适用场景 操作复杂程度 改造工作量 网关拦截 接入层,服务网关拦截写请求,放通读请求 入口统一,有统一网关,网关具有拦截能力,并对拦截的接口能配置友好的提示。 简单 无需改造 停止写服务,读服务不停 写服务或对应接口shutdown,读服务或对应接口保持alive 应用层服务已做读写
华为云账号是一个资源容器,用户可以在其中部署任意云资源和应用系统,不同的账号相当于不同的资源容器,账号之间是完全隔离的。因此在一个账号中的故障和安全风险不会影响和传播到其他账号。华为云账号也是安全管理边界,每个账号都有独立的身份和权限管理系统,一个账号内的用户只能访问和管理本账号的资源,未经允许
基础设施部署 基础设施部署主要是部署Landing Zone,有三种部署Landing Zone的方式。 由实施人员手动在华为云上部署Landing Zone,这种方式非常灵活,不受自动化工具的功能限制,但部署周期比较长。 基于资源治理中心完成自动化部署Landing Zone,
通连接和路由管理用企业路由器ER。 云上云下子网网段重叠、IP分开,需要二层互连打通用企业交换机ESW 云上云下子网网段重叠或因管理原因不允许直接打通两端子网段的路由,但业务需要互访,用私网NAT网关。 需要在云上自建高可用双机系统,建议两台ECS位于同一子网、跨可用区部署,绑定虚拟IP结合keep-alive实现。
调研:调研大数据平台的版本和配置信息、数量类型和数据量、任务类型和任务量。 设计:设计大数据的部署架构、数据迁移方案、任务迁移方案和数据校验方案。 部署:部署大数据平台,包括集群部署和任务调度平台部署。 迁移:实施数据迁移和任务迁移。 验证:进行数据校验和任务验证。 切换:配合大数据应用进行切换。
的可靠性和性能。您需要编写详细的组件使用文档和API说明,方便开发者查阅和使用。并且需要建立组件的版本管理机制,规范组件的升级和维护流程,确保组件的持续优化和迭代。 建立完善的监控和运维机制 为了保障平台和应用的稳定运行,需要建立覆盖基础设施、平台服务和应用层面的监控和运维机制。
获取流水账单和明细账单,按月度查看资金流水和资源扣费的详细信息。消费总计、付款情况、账单的明细数据等。 客户可以将华为云导出的账单和公司自己财务生成的账单进行多维度对账,以确认资源的购买、使用和账户的实际支出是否一致。 资金监控和资源包预警 华为云分别从账户资金余额和资源包剩余使
展。狭义上的IT运营模式是指企业管理和运营其IT资源、服务和基础设施的方式,它涉及到如何有效地配置、管理和优化IT资源,旨在提升性能和效率、降低成本、增强灵活性,以支持企业的业务目标和战略。广义上的IT运营模式还包括组织结构、运营流程、角色和职责等要素。简单来讲,IT运营模式是指
中间件层迁移方案 当前企业业务中使用比较多的中间件类型为缓存中间件和消息中间件。中间件作为数据存储的临时场所,数据一般不用迁移,但在切换时,为了确保源端和目的端数据的一致性,需要等中间件消息队列中的消息完成消费后再切换。如果中间件缓存数据是持久化的,即作为数据库使用,此场景需要进
或难以迁移的应用直接投入生产环境。 掌握经验:上云迁移试点可以让企业的技术团队和业务人员获得实践经验。在试点过程中,他们可以学习并熟悉云平台的特点、功能和最佳实践,了解迁移的工具和流程,并积累相关知识和技能,为后续的全面迁移做好准备。 确定优先级:通过试点迁移,企业可以评估不同应
、标签和资源。 流量型资源的公共成本按用量拆分:使用成本中心的共同成本分拆能力,可将CDN、Live等团队共享使用的云资源成本,按照实际用量分摊到域名或IP。 容器集群成本拆分:华为云提供CCE成本洞察,开通后可将CCE集群相关的CCE集群管理费、CCE集群关联的ECS和EVS资源费用拆分到集群、命名空间和工作负载。
云环境: 监控和警报设置:建立实时监控系统,监测集群、任务调度平台和应用程序的运行状态。设置警报,以便及时发现潜在的问题并采取措施。 优化集群性能:对大数据集群进行性能评估和调优。监视资源使用情况,优化配置参数、调整集群大小和资源分配,以提高整体性能。 数据安全和权限管理:审查和
修补系统和软件,确保使用的组件和版本都是最新的,并及时应用安全补丁。 备份和灾难恢复策略:评估和设置新的备份和灾难恢复策略,确保数据的安全性和可恢复性。执行定期备份,并进行灾难恢复演练来验证备份的可用性和恢复过程。 优化和调整:根据实际运行情况,进行系统和应用程序的优化和调整。监
接入层:通常是负载均衡、网关代理等组件,一般通过重新配置的方式实现迁移。 应用层:通常部署在主机或容器上,部署在主机上的应用一般通过华为云主机迁移工具SMS来迁,部署在容器上的应用,一般通过企业的CICD系统重新发布。 中间件层:通常是缓存中间件和消息中间件。缓存中间件一般通过华为云DCS
gC帮助文档。 资源发现与评估工具(RDA):是一个部署在Windows主机上的工具,用于评估上云驱动力和准备度,发现应用基础设施(例如虚拟机规格信息,CPU,内存利用率性能数据,网络拓扑数据等),并提供其迁移到华为云的推荐配置以及主机的一站式迁移能力。 主机迁移服务(SMS):
、安全和成本产生冲突时,对现金流紧张的企业来说,就要优先考虑成本低的设计方案,在安全、韧性方面可能就会有所妥协。 与高层和干系人对齐 在确定了云化转型驱动力和优先级之后, 将云化转型驱动力和优先级、预期收益清晰地记录下来,与企业高层和干系人进行沟通和对齐,听取他们的意见和建议,获取他们的理解和支持。
检查是否存在异常情况的错误信息。通过日志分析可以发现一些潜在的问题和隐患,及时进行修复和优化。 DNS劫持测试:因云上部署的业务一般按照生产环境的域名进行配置,在使用手机App或浏览器测试业务功能时,需要配合使用DNS劫持的方式进行测试,可以使用内网WIFI及运维改造的APIS