检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
确定性运维旨在构建可防、可控、可治的运维管理体系。通过高质量的产品开发,严谨的运维流程和制度来降低故障的概率,要挑战零故障。同时也要有技术手段对可能发生的故障进行管理,将故障间隔、故障影响范围及故障恢复时间做到可防、可控、可治。总而言之,要把数字化转型和业务快速发展带来的“不确定性”通过运维变成“确定性”。
概述 当企业上云规模逐渐变大,在云上有数十上百个应用系统和海量云资源,包括企业自有员工、外包员工及合作伙伴的员工在内的大量用户需要访问和操作这些云资源,量变导致质变,资源闲置、误操作、恶意操作、数据泄露和权限错配等风险将随着用云规模呈现指数级增长。 您需要开始着手构建精益化、集中
E是企业内部为云化转型专门成立的中心化团队,全程负责整个云化旅程,包括制定战略、顶层规划、调研评估、方案设计、采用实施和运维治理,其目标是通过提供最佳实践、指导和资源,帮助企业最大化云计算的价值,确保云化转型项目的成功实施。CCoE的主要责任如下: 制定云化战略:负责制定符合企业
支持标准SQL/Spark SQL/Flink SQL,支持多种接入方式,并兼容主流数据格式。数据无需复杂的抽取、转换、加载,使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。详细信息请参考官网文档。
难。 云服务丰富导致成本优化难:云服务商通常都提供数百个云服务和多样化的计费量纲,各服务也没有统一的调优方案。而且云厂商持续发布新服务、新实例类型和新的优惠。面对云上如此丰富的供应和选择,企业难以开展成本优化工作。 灵活开通导致精细化管控难:云的灵活扩展和支出限制少,有利于业务发展和创
节点故障而中断。 安全性和数据保护:云上部署的任务调度平台需要具备安全性和数据保护机制。确保对敏感数据和系统组件进行适当的访问控制和加密,以防止未经授权的访问和数据泄露。 性能优化:在云上部署任务调度平台时,需要考虑性能优化。优化资源配置、任务调度算法和数据分发策略,以提高任务执
成本预算计划 企业上云过程中,可以利用华为云的成本中心进行成本预算计划和管理。通过华为云的成本中心,企业可以实现对云开支的全面预算管理和监控,提高资源利用率,降低不必要的支出。合理的预算计划和持续的成本优化将有助于企业在云环境中获得更高的投资回报,实现业务的数字化转型目标。 制定预算计划时,可以参考以下内容:
(Availability Zone) 是公有云的一个独立的故障域,一个AZ是由物理上互相隔离的数据中心组成,每个AZ都具有独立的电力供应、网络连接和硬件设施,公有云厂商通常会将不同的AZ部署在不同的地理位置,以提高系统的可用性和故障容错能力,AZ故障域的优点包括: 高可用性:将应用程
在岗安全培训赋能:围绕信息安全意识、客户网络服务的业务规范、用户数据及隐私保护要求进行信息安全学习和考试,并根据业务变化定期刷新学习和考试大纲。 上岗资格管理:重点岗位员工必须通过信息安全上岗证的考试,并取得证书。通过证书管理平台对已通过安全上岗证考试的员工发放有效期不超过两年的电子证书,证书到期前提醒员工重新参加考试。
的反模式,以及对应的优化建议。 CCoE团队成员不够完善 CCoE是企业内部为云化转型专门成立的中心化团队,全程负责整个云化旅程,其目标是通过提供最佳实践、指导和资源,帮助企业最大化云计算的价值,确保云化转型项目的成功实施。CCoE就像云化转型的引擎,如果CCoE团队成员不够完善
务系统所需IaaS和PaaS资源的部署和运维,同时要确保业务系统的安全性和云资源的成本管理。中心IT团队仅负责制定统一IT标准和IT流程,通过发文的方式让各个业务系统采纳,并监管业务系统的执行情况,但没有办法强制业务系统执行这些标准和流程。在这个运营模式下,基本上不需要专门成立CCoE团队。
成本控制 通过预算管理,跟踪未来资源用量和费用执行 云资源按需灵活扩展,云成本在用云过程中不再固定不变。为了避免意外账单,需要在用云过程中精细化控制,对风险事项建立监控预警机制和应对机制,一旦产生预警则及时应对,避免产生异常高成本。在发生异常时,分析根因也至关重要。如发现异常成本
企业需要制定安全编码规范,要求应用系统的开发和测试人员在上岗前均需通过了对应规范的学习和考试。其次,企业需要引入了静态代码扫描工具进行每日检查,其结果数据将导入持续集成和持续部署(Continuous Integration,Continuous Deployment)工具链,通过质量门限进行控制,以评估应用系统
基于资源治理中心完成自动化部署Landing Zone,具体步骤请参考官网文档。但资源治理中心部署的是最小化Landing Zone,不一定符合企业的实际需求,还需要在此基础上通过手工或自动化的方式进一步设置Landing Zone。 使用华为云提供的资源编排服务RFS或第三方自动化工具(如Terraform等)实现Landing
由决策组负责人牵头对“决策点”进行决策 会务组 负责维护现场秩序,提供切换期间的会务保障。 每一行执行步骤都对应一个操作人和一个确认人(如涉及多人确认的情况,可以通过共享文档由多个分项确认人在线刷新确认进展)。 引导人通常是1~2个,是整个切换的总指挥(对于大规模切换,参与人员多,操作时间长的场景,也可
Region。 生产中心采用双AZ部署(双活、热备),容灾中心单AZ。 在生产和容灾中心分别部署RDS数据库实例,数据库 1:1:1 主备复制。 生产和容灾中心产生的配置、日志、快照和备份等,通过 OBS 实现跨区复制。 生产站点某个AZ故障时,切换到另一个AZ,数据库主备切换。 生产站点全体故障时,切换数据库的主备状态,然后将
Ingress网关高可用:ELB实例开启多可用区,ELB Ingress即支持跨可用区高可用。 应用高可用:K8S本身就支持应用高可用,可通过配置TopologyKey实现pod跨AZ分布。 图2 应用层高可用设计示例 中间件层-Redis高可用 主备实例配置了数据持久化,数据不仅会
设计迁移方案 迁移方案概述 接入层迁移方案 应用层迁移方案 中间件层迁移方案 数据层迁移方案 父主题: 应用迁移上云
迁移 接入层迁移实施 应用层迁移实施 中间件层迁移实施 数据层迁移实施 迁移实施常见问题 父主题: 应用迁移上云
、项目变更管理以及项目汇报机制,通过一系列机制保障项目在复杂场景下有序、平滑地开展。项目验收方案需要提前明确,基于项目目标以及业务诉求明确验收用例、验收指标、验收标准,确保业务系统上云后的功能和性能指标满足要求,这一步通常需要提前拉通业务部门和用户进行核心业务流程、关键指标的确认