检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
回退决策点设计原则如下: 每个切换阶段设计最晚的执行完时间,超时需要决策是否进行回退。 核心表数据比对结果不一致,需要决策是否回退。 核心的P0测试用不通过,需要决策是否回退。 性能验证不达预期,需要决策是否回退。 父主题: 设计Runbook
系统的安全性。 公共资源管理:企业内部的公共IT资源,如DNS服务器、容器镜像库、CA证书机构、云盘等由中心IT部门统一部署和管理。集中管理可以避免资源的重复建设和闲置浪费,提高资源利用率,降低采购和维护成本。 通过以上各个方面的集中管理,企业可以显著提高IT管理的效率和一致性。
的公共资源,进而集中部署和管理这些公共资源,同时也需要通过集中化的手段统一管理所有业务单元下的云资源,并进行集中的安全运营和成本管理。应用团队完全不用关心基础设施和云资源的部署和管理,可以将主要精力放在应用的设计、开发、测试、部署和运维工作上。 图1 集中化运营模式 集中化运营模式的优点如下:
可扩展性设计示例 应用上云目标架构的各层可扩展方案设计要点如下: 应用层可扩展设计要点 若应用层实现了微服务架构,通过华为云CCE云容器引擎服务实现业务容器化部署,可通过CCE工作负载弹性伸缩能力实现APP业务的水平扩展,随着负载增加,APP业务POD能自动扩展,随着负载的降低,A
应用层通常部署在物理机、虚拟机或容器内,应用的类型包括有状态和无状态两种。应用的部署方式和应用状态是应用层迁移方案设计时需要考虑的因素,不同的部署方式和应用状态适用的迁移方案不同。 平迁部署在主机上的应用 传统架构的应用,通常部署在物理机或虚拟机,建议优先通过华为云SMS主机迁移工
Framework(简称WAF)定期审查和评估云环境,根据业务需求和 WAF 的最佳实践进行调整和优化。您也需要持续学习和应用新的华为云服务和功能,不断提升云环境的成熟度。 通过将 WAF 的五大支柱与精益化治理、确定性运维、全方位安全运营和精细化FinOps相结合,可以构建一个持续优化、安全可靠、高性能、经济高效的云上环境,从而更好地支撑业务发展。
避免单云故障:将业务部署在单一云平台上存在单点故障风险。如果该云平台出现故障,例如大规模宕机或区域性灾难,企业的业务将受到严重影响。多云战略可以通过将业务系统部署在多个独立的云平台上,实现跨云容灾,避免单一云平台故障带来的业务中断。即使一个云平台出现问题,其他云平台上的业务仍然可以正常运行,保障业务连续性。
Connect提供的工具和平台,配置和设置必要的集成组件和连接器。确保正确地配置数据映射、消息路由和安全认证等关键参数。 测试和验证:在将集成应用投入生产之前,进行全面的测试和验证。确保新旧应用之间的数据传递和功能调用正常工作,并且没有任何破坏或冲突发生。 监控和维护:一旦集成应用上线,
Applications Manager 商用 ManageEngine是一个应用程序管理器的工具。这是一个通用服务器和应用程序监控工具,它支持对服务器和数据库、虚拟机、应用程序、Web服务和其他组件的监控。 Datadog 商用 Datadog是一款具有应用程序监控和映射功能的
浪费。 规模效应: 云计算本质上是规模经济,云服务商建设和运营超大规模的数据中心,具备超大的计算能力和存储容量。由于规模庞大,云服务商可以通过批量采购硬件和软件、优化资源利用率、提升能源利用效率和自动化管理等方式大幅降低运营成本,以更低的成本对外提供IT资源。 降低运维成本: 云服务商负责IT
的企业项目或者标签。功能团队映射为华为云IAM的用户组,成员则可以映射到华为云IAM的用户。生产、开发和测试等运行环境可以映射到不同的VPC,有时候为了严格隔离生产、开发和测试等运行环境,也会将其映射为独立的子账号。需要注意的是,不负责建设和运维业务系统或IT管理系统的子公司、分公司或部门不用映射到华为云。
设置警报机制,及时发现并解决潜在的问题。 系统监控和运维:设置系统监控和告警,确保及时发现和解决潜在的问题。配置基础设施监控工具,监测服务器、存储、网络等关键指标,并确保日志记录和错误报警机制正常运行。 安全检查和漏洞修复:进行安全检查,查找可能存在的漏洞或弱点,并采取适当的补
FinOps团队 FinOps团队的主要职责是通过成本生命周期管理和持续成本运营,推动团队在预算内高效使用云资源,不断提升云资源的成本效益,实现业务价值最大化。FinOps团队通常包含FinOps教练、云成本运营工程师,职责和技能要求如下表所示。 表1 FinOps团队的角色和职责
人力资源主管 云架构师、应用架构师、数据架构师、网络架构师 IT治理专家 运维主管、IT运维专家 CISO、安全专家、合规审计专家 应用开发专家、应用测试专家 应用运维专家 迁移实施工程师 项目经理 父主题: 云采用框架简介
、容量等。具体的调研内容如下: 调研应用的四层部署架构 收集接入层、应用层、中间件层和数据层的详细信息,收集三种关联关系(共享数据、共享服务器、应用间通信依赖),可以参考下表收集应用的详细部署架构: 表1 应用调研表 应用类型 接入层 应用层 中间件层 数据层 接入域名 备注 应用名称
扩展所需的产品和使用量,自主搭配产品进行未来成本的估算。 通过预算管理,跟踪未来资源用量和费用执行 预算超支是管理云成本核心难题之一。完成组织和成本的规划后,企业可以为各业务团队制定预算,并跟踪各业务团队预算执行情况。通过预算跟踪,确保各业务团队及时看到预算执行情况,并根据实际成本和预算的差异及时控制,避免预算超支。
降低能耗和碳排放:云数据中心通常采用先进的能源管理和冷却技术,PUE能降到1.2以下,相比自建数据中心,能耗和碳排放显著降低。 优化资源利用:云计算通过虚拟化和资源池化,提高了服务器和存储设备的利用率,减少了物理设备的需求。 支持绿色创新:云平台支持开发基于数字技术的绿色解决方案,如智慧城市、智能交通、在线协作工具等,助力环保和节能减排。
细粒度操作:将云资源的读、写、列表等操作进一步细化,对其细化操作进行鉴权,并将这些细化操作变成可供用户配置的权限操作。以云主机为例,将其读操作细化为读取规格、读取标签、读取服务器详情、读取挂载的磁盘、读取网卡等细粒度操作,这些细粒度操作在用户配置权限的时候是可以自由选择的,这样就可以将权限控制到用户所需的最小操作集合。
员乱打标签,您可以通过华为云提供的标签策略强制执行标签命名规范。 激活成本标签 使用标签按各种维度(例如用途、环境、部门等)对云资源进行成本分类之前,需要先进行成本标签激活,具体步骤请参考官网文档。 成本分析和优化 激活成本标签之后,进入“成本分析”页面,通过成本标签进行成本数据
确定性运维旨在构建可防、可控、可治的运维管理体系。通过高质量的产品开发,严谨的运维流程和制度来降低故障的概率,要挑战零故障。同时也要有技术手段对可能发生的故障进行管理,将故障间隔、故障影响范围及故障恢复时间做到可防、可控、可治。总而言之,要把数字化转型和业务快速发展带来的“不确定性”通过运维变成“确定性”。