检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
动态风险治理是应对不确定性和突发事件的重要保障手段。其本质也是对变更、故障模式、业务运行数据的识别开展全生命周期的主动运维和能力构建: 针对变更作业的风险,开展全面的能力建设,包括版本发布架构体系建设、账号权限管理、自动化变更能力建设等。 针对已知和未知的故障风险,通过科学的方法梳理故
云上可扩展性 云相较于传统IDC非常大的一个优势具备丰富的资源和强大的扩展能力;根据业务场景的不同需求,可以将扩展能力分成如下3类: 纵向(垂直)扩展:适用于单体应用、独立应用、有状态应用等场景下,随着业务不断发展和变化,需要快速升级硬件以应对业务变化。如在进行一些促销活动时,对
高可用性:将应用程序和数据部署在多个AZ上,确保即使一个AZ发生故障,其他AZ仍可提供服务,保证应用程序持续可用。 故障容错:在一个AZ发生故障时,可以快速地将应用程序和数据切换到其它正常的AZ上,以确保服务不中断。 地理冗余:将不同的AZ部署在不同的地理位置,可以防止地区范围的故障,例如自然灾害或电力中断对整个系统的影响。
一致性等。如果发现任何问题或异常情况,需要及时处理和修复。 业务正式切换 在确认目标大数据集群和任务调度平台的运行稳定性以及数据和任务迁移的完整性和准确性后,可以进行业务的正式切换,这包括将业务流量和作业任务切换到目标大数据平台上,并停止原大数据集群和任务调度平台。 父主题: 大数据迁移
标签最佳实践 标签设计原则 为华为云资源设计标签时,我们提供以下建议: 请勿在标签中存储用户身份信息或其他敏感信息。 对标签区分大小写格式,并跨所有资源类型一致地应用该格式。 虽然标签有长度规格上限,但尽量不要每个标签都达到标签规格上限,标签长度能标明含义即可。 提前识别标签的应
(例如使用RESTful API或消息队列)。在定义接口时,确保它们是清晰、一致且易于使用的。这样可以促进团队间的协作,并支持未来的扩展和变更。 另外,考虑采用开放标准和协议,如OpenAPI规范(前身为Swagger)来定义接口。这将使得各个微服务之间的集成更加简单,同时也方便文档生成和代码生成。
延,这种情况可以考虑单AZ部署,利用云服务主备、集群化部署模式来满足单个业务节点故障时快速恢复业务的需求,主要利用集群内节点故障自动探测和切换的方式来完成故障节点的恢复,消除业务单点,避免单点故障时业务受损。 双AZ(同城)高可用:对业务可用性要求比较高的业务,可以选择同城多机房
图1 资源共享方案 基于网络的共享:通过ER或VPC Peering将账号之间的网络打通,在此基础上进行资源共享,该方式仅限于拥有租户可见IP地址的资源,如NTP服务器、自建DNS服务器或者SFS文件存储等。 基于RAM的共享:通过华为云RAM服务设置资源共享,授权其他组织单元和账号
业务流程的影响,导致迁移后出现各种问题。 优化建议:要充分进行内、外部各种关联关系分析,识别强弱关联,并评估风险和影响,作为后续批次规划和切换方案的输入,将问题和影响降到最低。 通过识别并避免这些反模式,可以更加高效准确地进行上云调研评估,为企业的上云决策和方案设计提供有力支持。
调研应用上云需求 调研内容包括当前应用上云的需求和约束条件: 迁移时间窗 切换时间窗 目标架构的要求(功能、性能、可用性、安全、成本、可扩展性、可运维性) 回退要求 业务的关联关系确认。 调研方式包括人工访谈或Workshop头脑风暴,可以与前面2项调研内容合并调研,减少调研次数。
实现跨区复制。 生产站点某个AZ故障时,切换到另一个AZ,数据库主备切换。 生产站点全体故障时,切换数据库的主备状态,然后将 DNS 授权修改为容灾站点(生产站点 0%,容灾站点为 100%)。 生产站点修复后,数据库切换回主库,DNS 切换回主站点(生产站点 100%,容灾站点为
同步数据 所有 消息中间件迁移方案 确定消息中间件的切换场景 表3 消息中间件切换场景 适用产品 切换窗口 迁移方式 Kafka RabbitMQ RocketMQ ActiveMQ 切换时间窗充足 切换时间充足,业务评估在切换时间窗口内可以完成消息消费,此时,消息中间件中的数据
据轻松、平滑地迁移到华为云。通过第一次全量任务,将源端对象存储全量数据迁移至华为云OBS,业务切换时,在华为云配置回源规则,将部分增量数据,通过回源的方式迁移至华为云OBS,在业务切换后,再进行一次全量迁移,本次全量迁移,将自动跳过已经迁移的对象,将剩余增量数据迁移至华为云OBS。
计算服务选型 华为云提供的计算服务主要是ECS(Elastic Cloud Server)服务和CCE(Cloud Container Engine)服务,华为云提供了很多ECS的实例类型,如下表所示,以满足多样化的计算场景需求。关于上述ECS实例类型的详细信息,请查看实例类型。
的效率和准确性。 未进行切换演练 该反模式是企业未进行充分的切换演练,导致在正式业务切换时出现问题。 优化建议:在正式切换前进行全面的切换演练,模拟真实环境中的不同场景,及时发现并解决问题,确保系统在切换后能正常运行。 测试不充分 该反模式是指业务系统切换前测试不充分,导致潜在问
Rehost 也称为“直接迁移”或“Lift and Shift”,将应用程序原封不动地从本地数据中心迁移到云平台。通常使用工具将虚拟机或物理服务器转换为云中的虚拟机。 快速迁移到云平台,以降低成本或提高可用性。 需要快速完成迁移,时间紧迫。 缺乏应用程序的深入了解或修改代码的资源。 Replatform
企业的管理重点转向更高层次的操作,如应用程序的性能优化、数据管理和云安全。 敏捷性 硬件采购和部署周期较长,资源扩展需要经过复杂的审批和采购流程,响应速度较慢。 创新和变更受到硬件资源的限制,难以快速适应业务需求的变化。 云资源可以按需动态扩展或缩减,企业可以快速响应业务需求的变化。 部署新应用或功能的速度显著提高,支持敏捷开发和持续交付。
ess融合处理分析服务,支持标准SQL/Spark SQL/Flink SQL,支持多种接入方式,并兼容主流数据格式。数据无需复杂的抽取、转换、加载,使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。详细信息请参考官网文档。
规格选型,输出详细的迁移方案和切换方案。 部署:创建云上资源,上云适配改造(如涉及),并做目标环境测试。 迁移:将源端应用和数据迁移到云上目标环境。 验证:进行数据和业务验证。 切换:进行切换演练,刷新Runbook,实施正式切换。 保障:业务切换后进行一段时间的实时监控和特别运维保障。
数据库同步:云上使用RDS数据库服务,进行跨AZ主备部署,跨AZ间数据同步。 灾难恢复切换:当AZ发生故障时,RDS 数据库等自动切换至备库,应用层自动或者通过 SDRS 的一键容灾切换功能切换至其他AZ。 容灾演练:通过应用切换或 SDRS 提供的容灾演练功能进行一键演练。 进行双AZ高可用设计