检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云运维团队 云运维团队负责云基础设施的日常管理与维护,确保云基础设施的高可用性、高安全和高性能,协同应用运维管理员保障云上业务系统的长期安全稳定运行,并不断通过自动化和智能化技术提升运维效率。云运维团队通常包含云基础设施管理员、云网络管理员、数据库管理员和自动化工程师,职责和技能要求如下表所示。
运维治理 概述 精益化治理 确定性运维 安全运营 FinOps 持续优化
确定性运维 确定性运维是华为云基于自身多年的云服务运维经验沉淀的一套运维理念、方法论和最佳实践,可以帮助企业在云上高效运维自建和采购的业务系统,确保这些业务系统在云上能够持续高效稳定运行。 确定性运维旨在构建可防、可控、可治的运维管理体系。通过高质量的产品开发,严谨的运维流程和制
集中运维管理:借助AOM和COC等服务所提供的多账号统一监控和运维管理功能,所有业务单元的云资源的运维工作可以交给中心IT部门负责。通过建立标准化的运维流程和规范,对云资源的性能监测、故障处理、升级更新等进行统一管理。这种方式可以有效实施统一的运维管理标准,提升运维效率,减少运维成本。
CCoE团队和应用团队要紧密协同,共同保障业务系统在云上的安全稳定运行并实现最优的成本效益。在运维方面,CCoE团队负责云上IT基础设施(包括骨干网、IAM和合规审计系统等)的日常运维,各个业务单元的应用团队负责应用及所需云资源的日常运维,业务系统出现故障后两边协同进行故障定位和修复。在安全运营方面,CC
包含部门、用户、资源、策略、运维、审计等功能模块,集单点登录、统一资产管理、多终端访问协议、文件传输、会话协同等功能于一体。通过统一运维登录入口,基于协议正向代理技术和远程访问隔离技术,实现对服务器、云主机、数据库、应用系统等云上资源的集中管理和运维审计。关于CBH服务的详细功能和详细使用方法,请参考官网帮助文档。
RM、营销管理系统等。业务系统的开发、测试和运行需要消耗一定的计算、存储、网络、安全、数据库、中间件、大数据、AI服务等资源。大型业务系统能够包含多个子系统。 IT管理系统:为了支撑业务系统的长期安全稳定运行所建立的IT支撑和管理系统,如安全运营中心、IAM和监控运维系统等。 子
所有其他账号下的运维监控服务(AOM,CES,APM等)的管理权限 PaaS管理组 也叫中间件管理员,统一管理各个账号下的中间件资源 所有账号下中间件资源的管理权限 所有其他账号下的运维监控服务(AOM,CES,APM等)的管理权限 自动化运维组 统一监控和运维各个账号下的资源 运维监控账号的Tenant
子网。 公共服务和管理区主要功能 根据公共服务和IT管理系统的需要创建VPC和子网,用于部署公共服务和IT管理系统所需的云资源。公共服务包括AD、DNS、文件系统、OBS桶、数据平台等;IT管理系统包括运维管理系统、安全管理系统等。 按照生产、开发和测试等运行环境划分不同的VPC。
开发与运维现代化 通过DevOps实践,可以实现开发与运维的现代化。下面是一些步骤和实施建议: 文化转变:首先,要实现开发与运维的现代化,需要在组织中建立一个强调合作与共享的文化。开发团队和运维团队应该互相信任、合作,并且共同追求系统稳定性和持续交付。 自动化:自动化是DevOp
应的信息安全技能考试,提升自身信息安全能力。 重点岗位管理 为了内部有序管理,消减人员管理风险对业务连续性和安全性带来的潜在影响,建议您对运维工程师等重点岗位实施专项管理。具体如下: 上岗安全审查:针对新上岗人员,开展上岗人员安全审查,确保上岗人员背景和资历符合企业的信息安全要求。
W、云证书服务CCM、漏洞管理服务CodeArts Inspector 运维监控账号 统一监控和运维各个成员账号下的资源和应用,统一进行告警管理、事件处理和变更管理,并提供运维安全保障措施 运维团队 应用运维管理AOM、COC、云日志服务LTS、应用性能管理APM、云堡垒机CBH等
CCE集群相关的CCE集群管理费、CCE集群关联的ECS和EVS资源费用拆分到集群、命名空间和工作负载。 多维度分类和汇总:使用成本单元,综合多种条件(产品类型、账单类型、关联账号、企业项目、成本标签)对成本进行分类和汇总,如品牌维度、子系统维度等。 公共成本分配:使用成本单元的
部因素包括业务增长需求、成本优化需求、运营效率提升和业务创新需求等,外部因素包括市场竞争压力、客户需求变化、技术发展趋势和监管合规要求等。综合考虑这些内部和外部因素,总体上可以将云化驱动力分解为业务驱动力、技术驱动力和财务驱动力三种驱动力,分别对应CEO、CIO和CFO的视角。 父主题:
到使用云数据库服务。这通常不涉及修改核心应用程序代码。 希望利用云平台的PaaS服务,例如数据库、消息队列等,以减轻自建数据库和消息队列的运维压力。 需要提高应用程序的性能或可扩展性。 不需要进行大规模代码修改,但希望优化应用程序在云平台上的运行。 Rearchitect 对应用
的服务器访问,从而在请求来源和被访问资源两个角度保障了安全性。关于如何配置双端固定,请查看这个链接。 全方位数据边界的构建,是一个系统性和综合性的工程,需要企业在身份、网络和资源三个层面都实施严格的控制策略。只有三者相互配合,才能真正构筑起坚不可摧的数据安全屏障。 父主题: 精益化治理
如何选择试点应用 试点应用的选择应该站在整体角度综合考虑是否满足优先试点的条件,选择试点应用时可以考虑如下因素: 上云意愿:企业推行全面上云时,不同业务部门的上云意愿是不一样的,可以优先考虑意愿度高、有充足的人力和时间、投入积极的业务。 业务重要性:根据企业现有的应用和业务,选择
可用性(Availability)是产品/服务在规定的条件下和规定的时刻或时间区间内处于可执行规定功能状态的能力,是产品可靠性和可维护性的综合反映。服务可用性一般会用SLA(Service-Level Agreement)来衡量,各类云服务都有承诺的SLA标准。不同SLA级别对应的停机时间如下表所示:
数据中心退役 - 提升资源弹性 提升系统韧性 提升扩展性 提升安全性 提升运维效率 提升性能效率 按需付费 降低成本 合并和拆分 提升业务敏捷性 提升资源弹性 提升扩展性 - 现金流紧张 - 提升资源弹性 提升运维效率 提升性能效率 按需付费 降低成本 关键技术终止服务 提升业务连续性
组建运维治理团队 开展任何工作之前必须确保有具备相应技能水平的人高效完成这些工作,运维治理阶段主要的工作包括精益化治理、确定性运维、安全运营和FinOps。请参考云卓越中心 所描述的角色职责和技能要求,结合企业的实际情况组建运维治理阶段需要的团队,包括云治理团队、云运维团队、云安全团队和FinOps团队。