检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云运维团队通常包含云基础设施管理员、云网络管理员、数据库管理员和自动化工程师,职责和技能要求如下表所示。 表1 云运维团队的角色和职责 角色 职责 技能要求 来源 云基础设施管理员 负责云平台上存储、虚拟机、操作系统等基础设施的日常运维管理。
这种方式可以有效实施统一的运维管理标准,提升运维效率,减少运维成本。 集中安全管理:网络安全是企业运营的重中之重。
重点岗位管理 为了内部有序管理,消减人员管理风险对业务连续性和安全性带来的潜在影响,建议您对运维工程师等重点岗位实施专项管理。具体如下: 上岗安全审查:针对新上岗人员,开展上岗人员安全审查,确保上岗人员背景和资历符合企业的信息安全要求。
运维治理 概述 精益化治理 确定性运维 安全运营 FinOps 持续优化
确定性运维 确定性运维是华为云基于自身多年的云服务运维经验沉淀的一套运维理念、方法论和最佳实践,可以帮助企业在云上高效运维自建和采购的业务系统,确保这些业务系统在云上能够持续高效稳定运行。 确定性运维旨在构建可防、可控、可治的运维管理体系。
知识转移则是在业务系统上线后,需要为业务部门的应用运维团队进行云技术的赋能,保证应用运维团队具备在云平台上对业务系统进行必要的日常运维管理和事件处理的能力。 父主题: 顶层规划
精细化成本运营 精细化成本运营基于FinOps 理念,将财务管理与云资源运营相结合,旨在帮助企业优化云资源的使用和成本管理。 通过基于FinOps 的成本全生命管理体系,企业可以在云环境中实现精细化的成本控制和资源分配。
组织分级分域管理 组织分级分域管理是一种在现代企业治理中至关重要的方法,特别是在云计算环境下,随着业务的扩展和多样性的发展,这种管理方式变得越来越重要。
基础设施即代码(IaC):采用基础设施即代码的方法可以将基础设施配置和管理纳入代码库中。这样可以确保基础设施的可重复性、版本控制和自动化部署,从而提高整个环境的稳定性和可靠性。 集中日志和监控:通过集中管理日志和监控数据,可以实时了解系统运行状况,并及时发现和解决问题。
应用系统所需的云资源由CCoE团队负责集中部署和运维,应用团队完全不用关心基础设施和云资源的部署和管理,可以将主要精力放在应用系统的设计、开发、测试、部署和运维工作上。
、更灵活的组织映射 预算管理(含预算报告) 计划跟踪所需粒度的云支出,及时获取超预算提醒,或定期周知最新进展 管理账单与控制成本 资金管理 监控可用额度,跟踪支出异常 资源包管理 监控资源包是否即将用尽 账单管理 了解各帐期的实际消费与支出,多维对账 成本监控 监控云支出的异常增长
公共服务管理 首先您要识别出各个业务单元所需要的公共IT服务和资源,比如NTP服务器、SFS文件存储、自建DNS服务器、OBS桶、虚拟机镜像、证书等,也可以是CodeArts等PaaS服务。然后集中部署和维护这些公共IT服务,将其共享给公司内所有业务单元。
华为云提供了通用的预算管理工具,您可以根据企业实际规划的预算,用预算管理工具跟踪起来,并可以设置细粒度的过滤条件,精细化跟踪具体产品、团队、项目的成本。
统一运维管理 以运维监控账号为中心,在这里集中部署云运维中心(Cloud Operation Center,COC)和应用运维管理服务(Application Operations Management,AOM),针对其他子账号进行统一的监控和运维管理,如下图所示。
容器集群成本拆分:华为云提供CCE成本洞察,开通后可将CCE集群相关的CCE集群管理费、CCE集群关联的ECS和EVS资源费用拆分到集群、命名空间和工作负载。
成本控制 通过预算管理,跟踪未来资源用量和费用执行 云资源按需灵活扩展,云成本在用云过程中不再固定不变。为了避免意外账单,需要在用云过程中精细化控制,对风险事项建立监控预警机制和应对机制,一旦产生预警则及时应对,避免产生异常高成本。在发生异常时,分析根因也至关重要。
该指南包括身份与访问管理、日志与监控、虚拟机与容器、网络、存储、数据库、企业智能等方面的安全配置,但并不是所有可能的安全配置的详尽列表。建议您将该指南作为一个起点,并根据实际需要在此基础上进行补充或裁剪。
FinOps是“Finance”和 “DevOps”的结合,推崇业务团队和工程团队(IT团队)之间的沟通和协作,目的是解决企业管理云成本难题。
概述 云计算从根本上改变了IT基础设施和应用系统的建设、运维和管理方式。传统模式下,组织通常需要购买、安装和运维自己的硬件和软件,包括服务器设备、存储设备、网络设备、虚拟化软件、操作系统、数据库管理软件和中间件等IT基础设施,资源部署周期长,运维负担重,初始投资大。
其次,确定性运维旨在构建可防、可控、可治的运维管理体系,把数字化转型和业务快速发展带来的“不确定性”通过运维变成“确定性”,保障应用系统的长期稳定运行,减少故障和停机时间。