检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础环境设计 企业在云上的基础环境主要就是Landing Zone,企业在将任何业务系统云化之前,都需要提前规划和设计一个架构卓越、稳定可靠、易扩展和安全合规的云上运行环境。 具体内容请参考章节 Landing Zone设计。 企业需要针对云环境的安全防护设计全面的安全防护方案,请参考章节安全架构设计。
一般通过企业的CICD系统重新发布。 中间件层:通常是缓存中间件和消息中间件。缓存中间件一般通过华为云DCS迁移工具来迁移,消息中间件,一般不迁移,待消费者服务消费完通道内的消息后,整个消息中间件直接切换到华为云。 数据层:包括数据库、对象存储、文件系统,数据库一般通过华为云的
负责云平台上存储、虚拟机、操作系统等基础设施的日常运维管理。 监控和优化云资源的使用效率,确保资源分配合理。 处理虚拟机、存储和操作系统相关的故障,保障系统的高可用性。 定期进行系统补丁更新和安全加固。 熟悉主流云平台的虚拟机和云存储服务。 掌握Linux和Windows操作系统的管理与优化。 熟悉云原生的监控运维工具。
相关性原则:不需要把企业内部的完整组织架构映射到华为云上,只把那些负责管理IT系统的组织单元(如部门、分公司)和使用IT资源的用户映射到华为云上。如行政部门不管理、不查看、不操作任何云上IT资源,就不需要在华为云上创建一个对应行政部门的组织单元;如财务小张不负责IT系统的成本核算、分析和预算管理,就无需为小张在华为云上创建一个拥有财务管理权限的用户。
确认操作人的操作步骤是否正常执行完成,并向引导人反馈执行结果,如遇异常,需要按Runbook约定要求,定期向引导人员同步处理进展。 引导人 引导Runbook的执行,通报问题处理进展 记录人 刷新Runbook的执行状态,记录Runbook中各个步骤的完成时间,记录问题处理时长 决策组 由决策组负责人牵头对“决策点”进行决策
作业双跑 在增量作业迁移和同步成功后,进行作业双跑。作业双跑是指在新的大数据平台上同时运行原有系统和新系统的作业,以验证新系统的结果和原有系统的一致性。这可以通过比较作业输出、日志和指标等来判断两个系统的结果是否一致。 应用割接 最后,作业双跑一段时间没有问题后,就可以进行大数据应用割接,业务全部切换到新大数据平台。
大数据平台的部署可以参考如下方法: 大数据集群部署 基于架构设计的原则,云上大数据集群一般采用云服务。华为云MRS是一个在华为云上部署和管理Hadoop系统的服务,一键即可部署Hadoop集群。MRS提供租户完全可控的企业级大数据集群云服务,轻松运行Hadoop、Spark、HBase、Kaf
护和集中安全运营,应用团队则需要负责应用系统及所需云资源的安全运营。然后在安全云脑中为CCoE团队和各个应用团队分配安全运营的工作空间,在保证各应用团队的安全职责清晰划分的同时,可以向CCoE团队提供统一的安全运营管理视图,最后将业务系统运行环境的安全数据、资产,纳管对接到统一的
安全配置基线 安全配置是信息系统的最小安全保障,云安全配置是云环境最基本的安全保证,是开展安全防护和安全运营的基础。 如果云服务没有达到安全配置基线要求,云上业务及资产将面临巨大安全风险。为了帮助客户提高云环境的安全防护能力,华为云为客户提供了华为云安全配置基线指南。该指南包括身
的成本全生命管理体系,企业可以在云环境中实现精细化的成本控制和资源分配。这种管理体系允许企业按照不同的粒度进行成本分析和管理,包括子公司、业务系统、产品线、部门、项目,甚至是微服务级别。这种细粒度的管理使得企业能够准确识别各个业务单元的成本消耗情况,从而做出更明智的决策。通过实施Fi
缺乏云架构师: 缺失专业的云架构师会导致云化转型如同无舵之舟。架构设计缺乏整体规划,系统扩展性差,难以维护,容易形成“拼凑式”的云环境,资源利用率低。技术选型不当则可能导致性能问题、成本超支和安全风险。此外,现有系统与云平台的整合也将面临挑战,难以充分利用云原生特性。最终,企业将难以发挥云平台的优势,甚至面临安全和性能瓶颈。
设计存在单点故障 架构设计时未考虑高可用性,导致关键组件成为单点故障,一旦发生故障,整个系统将无法正常工作。 优化建议:实现冗余设计,采用负载均衡策略,确保应用的关键服务在多节点上运行,提升系统的可靠性和可用性。 架构设计未考虑业务的地理分布 设计云上部署架构时,未考虑业务的地理分布,导致用户访问延迟高,体验不好。
方案和改进措施等,总结迁移试点对企业的业务影响和收益。 技术和性能评估:评估试点迁移后的系统和应用程序的性能和稳定性,考虑应用程序的可伸缩性、响应时间、数据传输速度等因素,总结试点迁移对系统性能和用户体验的影响。 成本效益分析:分析上云迁移试点对企业成本的影响,包括成本节约、资源
移的执行主要是按照批次规划逐批次进行迁移,如下图: 图1 分批迁移 整体迁移:对于不能分批的,应用的关联关系往往非常复杂,只能选择所有业务系统整体一个批次迁移,如下图: 图2 整体迁移 父主题: 采用实施
调研评估 概述 组建调研评估团队 基础设施调研 应用系统调研 大数据调研 调研方式 云服务选型 调研评估的反模式
是公有云的一个独立的故障域,一个AZ是由物理上互相隔离的数据中心组成,每个AZ都具有独立的电力供应、网络连接和硬件设施,公有云厂商通常会将不同的AZ部署在不同的地理位置,以提高系统的可用性和故障容错能力,AZ故障域的优点包括: 高可用性:将应用程序和数据部署在多个AZ上,确保即使一个AZ发生故障,其他AZ仍可提供服务,保证应用程序持续可用。
同保障业务系统的安全稳定运行、保障关键数据的安全。然而,安全运营面临着很多挑战。 安全体系越来越复杂 随着数字化转型的深入,企业的ICT环境变得日益复杂。云计算、网络管道、终端设备、边缘计算、操作系统、数据库、应用程序等多个层面交织在一起,形成了一个庞大而复杂的生态系统。每个环节
用停服方式进行切换。从业务对外体验上,多数用户感知不到停服的影响,比如某购物平台,用户仍然可以浏览商品,但是不能下单,下单时可友好的提示:系统正在升级中,预计凌晨4点恢复,请您稍后重试下单等。 四种停写不停读切换方案对比 停写不停读切换有4种方案可以选择: 表1 四种停写不停读切换方式
保障 在大数据迁移的保障阶段,需要执行以下任务来确保顺利过渡到新的云环境: 监控和警报设置:建立实时监控系统,监测集群、任务调度平台和应用程序的运行状态。设置警报,以便及时发现潜在的问题并采取措施。 优化集群性能:对大数据集群进行性能评估和调优。监视资源使用情况,优化配置参数、调整集群大小和资源分配,以提高整体性能。
概述 当企业上云规模逐渐变大,在云上有数十上百个应用系统和海量云资源,包括企业自有员工、外包员工及合作伙伴的员工在内的大量用户需要访问和操作这些云资源,量变导致质变,资源闲置、误操作、恶意操作、数据泄露和权限错配等风险将随着用云规模呈现指数级增长。 您需要开始着手构建精益化、集中