检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
确定性运维 确定性运维是华为云基于自身多年的云服务运维经验沉淀的一套运维理念、方法论和最佳实践,可以帮助企业在云上高效运维自建和采购的业务系统,确保这些业务系统在云上能够持续高效稳定运行。 确定性运维旨在构建可防、可控、可治的运维管理体系。通过高质量的产品开发,严谨的运维流程和制度来降低故
要在云化转型早期就组建一个完整的CCoE组织。 云化转型早期主要是把第一批业务系统迁移或直接部署在云上,这个时候可以建立一个小型化CCoE组织,如下图所示,把必要的角色加入进来,足以支撑第一批业务系统的云化就可以。 我们认为在早期的小规模CCoE组织中应该包含指导委员会、云项目经
Zone 为了实现业务单元的安全和故障隔离,华为云的推荐做法是将不同业务单元的应用系统分别部署在不同的账号中。华为云账号具备以下三个属性。 华为云账号是一个资源容器,用户可以在其中部署任意云资源和上层业务应用系统,不同的账号相当于不同的资源容器,账号之间是完全隔离的。因此在一个账号中的故障和安全风险不会影响和传播到其他账号。
相关性原则:不需要把企业内部的完整组织架构映射到华为云上,只把那些负责管理IT系统的组织单元(如部门、分公司)和使用IT资源的用户映射到华为云上。如行政部门不管理、不查看、不操作任何云上IT资源,就不需要在华为云上创建一个对应行政部门的组织单元;如财务小张不负责IT系统的成本核算、分析和预算管理,就无需为小张在华为云上创建一个拥有财务管理权限的用户。
负责维护现场秩序,提供切换期间的会务保障。 每一行执行步骤都对应一个操作人和一个确认人(如涉及多人确认的情况,可以通过共享文档由多个分项确认人在线刷新确认进展)。 引导人通常是1~2个,是整个切换的总指挥(对于大规模切换,参与人员多,操作时间长的场景,也可以设计2~3名引导人,互为备
司、业务系统、产品线、部门、项目,甚至是微服务级别。这种细粒度的管理使得企业能够准确识别各个业务单元的成本消耗情况,从而做出更明智的决策。通过实施FinOps,企业可以提升资源使用效率,避免资源浪费,并在不影响业务性能的前提下降低成本。关于FinOps的详细实践,请查看本章后面的内容。
复杂的计算和分析任务。 数据查询和分析: 对于大量的存储在大数据平台中的数据,需要提供灵活且高性能的查询和分析能力。这可以通过使用SQL查询引擎(如Hive)或分布式数据库(如Elasticsearch)等实现。这些工具和系统支持在海量数据集上进行查询、聚合和可视化,以提供数据洞见和决策支持。
负责云平台上存储、虚拟机、操作系统等基础设施的日常运维管理。 监控和优化云资源的使用效率,确保资源分配合理。 处理虚拟机、存储和操作系统相关的故障,保障系统的高可用性。 定期进行系统补丁更新和安全加固。 熟悉主流云平台的虚拟机和云存储服务。 掌握Linux和Windows操作系统的管理与优化。
ble)、相关的(Relevant)和有时限的(Time-bound)。例如,如果组织经常因为业务系统中断导致收入减少和品牌受损,可以制定一个具体的业务目标:“在未来一年,将业务系统的可用性从99%提升到99.9%”。在设定云化目标时,您还需要充分考虑组织的资源和能力现状,确保目
资源的弹性速度。 提升系统韧性 系统韧性是指系统在面对各种外部灾难和内部软硬件故障时,仍然能够维持正常运行或快速恢复的能力。云平台和云服务能够大幅提升应用系统的韧性,从而有效提升业务连续性。 高可用架构:云服务商提供多地域、多可用区的部署模式,支持应用系统设计跨机房、跨地域的容灾
证云上业务系统在各种情况下的稳定性和可靠性,包括系统资源的管理、数据传输、异常处理等。 评估系统的可扩展性:在系统压力逐步增大的过程中,测试云上业务系统的可扩展性,可以确定系统是否可以扩展到更大的规模,并支持更多的用户和业务需求 识别系统的性能瓶颈:通过对云上业务系统的压力测试,
单元的故障或安全问题可能会影响到其他业务单元,甚至整个系统。而通过将不同的业务单元部署在独立的云账号中,企业可以有效地隔离故障和风险,防止问题的扩散。举个例子,如果某个业务系统遭遇了安全攻击,攻击者可能只能够接触到该业务系统所在的云账号中的资源,无法进一步影响到其他业务单元。这种
存放的是对象,可以直接存放文件,文件会自动产生对应的系统元数据,用户也可以自定义文件的元数据 访问方式 只能在ECS/BMS中挂载使用,不能被操作系统应用直接访问,需要格式化成文件系统(OS层,不涉及应用改造) 在ECS/BMS/CCE中通过网络协议挂载使用,支持NFS/CIFS(通用文件系统不支持CIFS),需
基础环境设计 企业在云上的基础环境主要就是Landing Zone,企业在将任何业务系统云化之前,都需要提前规划和设计一个架构卓越、稳定可靠、易扩展和安全合规的云上运行环境。 具体内容请参考章节 Landing Zone设计。 企业需要针对云环境的安全防护设计全面的安全防护方案,请参考章节安全架构设计。
业务敏捷性是指企业迅速响应市场变化和客户需求的能力。在快速变化的市场环境中,企业需要具备敏捷的业务能力,以保持竞争优势。 快速部署业务系统:云平台提供了高度灵活和可扩展的基础设施,企业可以迅速部署业务系统和服务,缩短上市时间。 快速弹性伸缩:云计算的弹性特性使企业能够根据业务需求,动态调整资源配置,快速满足业务高峰期或突发性需求。
提升端到端项目管理和应用交付的效率。 业务系统上线管理 业务系统上线管理的目的是保障业务系统上线过程中业务依然能够平稳运行,将对业务的影响和风险降低或消除。业务系统上线管理涵盖环境准备、组织宣贯、风险应急和割接上线实施等环节。 业务系统割接上线前云环境准备通常包含业务环境部署,数
计量计费等。调研的方式主要是从IT系统导出(如CMDB、CMP、虚拟化管理软件),并结合问卷访谈。基础环境的调研主要是找企业的运维团队。调研人员会与企业的运维团队合作,收集与基础环境相关的数据和信息。 一种常见的调研方式是通过企业内部的IT系统导出信息,例如配置管理数据库(CMD
以及持续监控和审计系统活动,以及时发现和应对安全威胁。 性能效率支柱 性能效率支柱关注如何高效地使用云资源,满足系统性能需求并适应业务的变化。它强调通过性能规划、性能建模、性能分析、性能优化等手段确保系统能够在不同的负载条件下保持最佳性能。企业需要持续监控系统性能指标,优化应用程
云卓越中心简介 如上述所,企业云化转型是一项复杂和系统的工程,需要组建一个云卓越中心(CCoE)来领导、协调和推进整个云化转型项目。CCoE是企业内部为云化转型专门成立的中心化团队,全程负责整个云化旅程,包括制定战略、顶层规划、调研评估、方案设计、采用实施和运维治理,其目标是通过
个环境的稳定性和可靠性。 集中日志和监控:通过集中管理日志和监控数据,可以实时了解系统运行状况,并及时发现和解决问题。选择适当的日志管理和监控工具,并定义关键指标(KPIs)和警报规则,以确保系统的可用性和性能。 容器化和微服务架构:采用容器化技术(例如Docker)和微服务架构