检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云运维团队 云运维团队负责云基础设施的日常管理与维护,确保云基础设施的高可用性、高安全和高性能,协同应用运维管理员保障云上业务系统的长期安全稳定运行,并不断通过自动化和智能化技术提升运维效率。
集中运维管理:借助AOM和COC等服务所提供的多账号统一监控和运维管理功能,所有业务单元的云资源的运维工作可以交给中心IT部门负责。通过建立标准化的运维流程和规范,对云资源的性能监测、故障处理、升级更新等进行统一管理。
重点岗位管理 为了内部有序管理,消减人员管理风险对业务连续性和安全性带来的潜在影响,建议您对运维工程师等重点岗位实施专项管理。具体如下: 上岗安全审查:针对新上岗人员,开展上岗人员安全审查,确保上岗人员背景和资历符合企业的信息安全要求。
运维治理 概述 精益化治理 确定性运维 安全运营 FinOps 持续优化
确定性运维 确定性运维是华为云基于自身多年的云服务运维经验沉淀的一套运维理念、方法论和最佳实践,可以帮助企业在云上高效运维自建和采购的业务系统,确保这些业务系统在云上能够持续高效稳定运行。 确定性运维旨在构建可防、可控、可治的运维管理体系。
知识转移则是在业务系统上线后,需要为业务部门的应用运维团队进行云技术的赋能,保证应用运维团队具备在云平台上对业务系统进行必要的日常运维管理和事件处理的能力。 父主题: 顶层规划
组织分级分域管理 组织分级分域管理是一种在现代企业治理中至关重要的方法,特别是在云计算环境下,随着业务的扩展和多样性的发展,这种管理方式变得越来越重要。
开发与运维现代化 通过DevOps实践,可以实现开发与运维的现代化。下面是一些步骤和实施建议: 文化转变:首先,要实现开发与运维的现代化,需要在组织中建立一个强调合作与共享的文化。开发团队和运维团队应该互相信任、合作,并且共同追求系统稳定性和持续交付。
业务可用性目标的达成是一项系统工程,公有云模式下,业务的可靠性取决于客户对整体业务架构的可用性设计、运维规范管理(如:备份机制、日常演练、人员操作规范等)。
安全编码与测试 企业需要制定安全编码规范,要求应用系统的开发和测试人员在上岗前均需通过了对应规范的学习和考试。
精细化成本运营 精细化成本运营基于FinOps 理念,将财务管理与云资源运营相结合,旨在帮助企业优化云资源的使用和成本管理。 通过基于FinOps 的成本全生命管理体系,企业可以在云环境中实现精细化的成本控制和资源分配。
公共服务管理 首先您要识别出各个业务单元所需要的公共IT服务和资源,比如NTP服务器、SFS文件存储、自建DNS服务器、OBS桶、虚拟机镜像、证书等,也可以是CodeArts等PaaS服务。然后集中部署和维护这些公共IT服务,将其共享给公司内所有业务单元。
应用系统所需的云资源由CCoE团队负责集中部署和运维,应用团队完全不用关心基础设施和云资源的部署和管理,可以将主要精力放在应用系统的设计、开发、测试、部署和运维工作上。
、更灵活的组织映射 预算管理(含预算报告) 计划跟踪所需粒度的云支出,及时获取超预算提醒,或定期周知最新进展 管理账单与控制成本 资金管理 监控可用额度,跟踪支出异常 资源包管理 监控资源包是否即将用尽 账单管理 了解各帐期的实际消费与支出,多维对账 成本监控 监控云支出的异常增长
表1 九大领域对应的主要账号 九大领域 对应的主要账号 组织与账号管理 主账号(管理账号) 身份与权限管理 主账号(管理账号) 集中网络管理 网络运营账号 共享服务管理 公共服务账号 统一安全管理 安全运营账号 统一合规审计 安全运营账号、日志账号 统一运维管理 运维监控账号 统一财务管理
提前识别标签的应用场景,比如成本管理、运维和自动化、细粒度权限控制、数据分类、安全运营等,并据此制定标签键值规范,下面会介绍。 标签键值规范 根据标签设计原则制定企业范围内的标签键值规范,所有用户在给云资源打标签时需要严格遵守这些键值规范,标签键值规范的典型示例如下表所示。
统一运维管理 以运维监控账号为中心,在这里集中部署云运维中心(Cloud Operation Center,COC)和应用运维管理服务(Application Operations Management,AOM),针对其他子账号进行统一的监控和运维管理,如下图所示。
华为云提供了通用的预算管理工具,您可以根据企业实际规划的预算,用预算管理工具跟踪起来,并可以设置细粒度的过滤条件,精细化跟踪具体产品、团队、项目的成本。
概述 云计算从根本上改变了IT基础设施和应用系统的建设、运维和管理方式。传统模式下,组织通常需要购买、安装和运维自己的硬件和软件,包括服务器设备、存储设备、网络设备、虚拟化软件、操作系统、数据库管理软件和中间件等IT基础设施,资源部署周期长,运维负担重,初始投资大。
运维管理 标签是云运维实践的重要组成部分,它不仅提高了工作效率,帮助云运维团队更好地掌控复杂的IT环境。标签对于云运维具有多方面的重要意义,主要体现在以下几个方面: 简化资源管理:标签允许运维人员以更灵活的方式管理和组织云资源。