检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图1 小型化CCoE组织架构 当企业云化转型的规模逐步变大,云化转型进入运维治理阶段的时候,可以将小型化的CCoE组织逐步扩大,增加更多的运维治理阶段所需的关键角色,如云基础设施管理员、云网络管理员、数据库管理员、应用运维管理员、云治理专家、安全运营工程师、云成本运营工程师等,逐步演进到如下全功能的
组织可以开展一系列宣讲会、培训课程,制作宣传手册、视频等,详细讲解云化转型的意义、目标和具体举措。例如,组织可以在内部网站开设云化转型专栏,定期发布相关信息和进展。
运维防线 要限制只能从安全的网络环境发起运维活动,并为运维人员建立专门的运维访问通道,如让运维人员使用专门的运维服务、堡垒机接入运维,尽量减少黑屏运维操作,降低运维活动过程中的不确定性,确保运维的活动可审计可追溯。
缩略语 表1 缩略语(按照字母顺序) 缩略语 英文全称 中文全称 AIOps Artificial Intelligence for IT Operations 智能运维 AOM Application Operations Management 应用运维管理服务 ALM Application
云计算可以极大加快您的组织建设和扩展IT基础设施的速度,也可以极大简化IT基础设施的运维管理工作,使您的组织能够聚焦在应用系统的开发和运维等高价值领域。IT基础设施有时候也叫做技术平台或技术中台。基于云计算构建的IT基础设施也称作云基础设施。
它强调实践DevOps、基础设施即代码、自动化部署、测试验证和自动化运维任务,建立全面的监控、日志记录和告警机制。通过精心设计的操作流程、变更管理和持续改进方法,企业能够快速响应变化,减少错误,提升团队协作效率,确保业务目标的实现。
保障:业务切换后进行一段时间的实时监控和特别运维保障。 请参考大数据调研的调研方法,调研大数据集群、大数据任务调度平台和大数据应用的现状信息。 父主题: 大数据迁移
华为云将其基础设施的安全与隐私保护视为运维运营安全的重中之重。基础设施主要包括支撑云服务的物理环境,华为自研的软硬件,以及运维运营包括计算、存储、网络、数据库、平台、应用、身份管理和高级安全服务等各项云服务的系统设施。
云运营与运维 主要评估组织在云环境下的运营和运维能力,包括可观测性、CMDB、自动化运维、混沌工程、ITSM和AIOps等。同时评估组织是否建立了最适合业务现状的云运营模式和运维流程,以支撑云上业务系统的敏捷交付和稳定运行。
运维治理:将应用系统迁移或部署到云上之后就进入了运维治理阶段,在该阶段需要针对云基础设施、应用系统和大数据平台进行持续的精益化治理、确定性运维、持续安全运营和成本运营,并基于WAF框架进行持续优化。
由于规模庞大,云服务商可以通过批量采购硬件和软件、优化资源利用率、提升能源利用效率和自动化管理等方式大幅降低运营成本,以更低的成本对外提供IT资源。 降低运维成本: 云服务商负责IT 基础设施的维护和管理,企业无需投入大量人力和资金进行IT基础设施的日常运维。
每个运维工程师可运维的资源数量 将每个运维工程师可管理的服务器数量提升 2 倍,从100台提升至200台。 父主题: 制定战略
华为云大数据组件 常用的华为云大数据服务组件如下,设计大数据部署架构时可参考: MapReduce服务(MapReduce Service,简称MRS) MRS是一个在华为云上部署和管理Hadoop系统的服务,一键即可部署Hadoop集群,完全兼容开源接口,轻松运行Hadoop、Spark
运维主管 提高运维效率,减少故障和停机时间。 实现运维自动化,降低人力成本。 提升系统的可用性和可靠性,支持业务连续性。 基于云平台的特点制定云运维流程和标准。 推广云运维工具的使用,实现自动化和智能化。 培训运维团队,提升云运维技能。
平台工程对企业带来的价值如下: 提升开发者体验: 平台工程提供自助服务功能,简化了基础设施配置、应用部署和管理等流程,让开发者更专注于业务逻辑的开发,而不是底层基础设施的管理。
IT管理账号设计原则:针对IT部门,可以按照企业当前的IT职责划分不同的IT管理类子账号,如安全运营、运维监控、网络运营、数据平台等子账号。 父主题: Landing Zone设计
华为云MRS是一个在华为云上部署和管理Hadoop系统的服务,一键即可部署Hadoop集群。MRS提供租户完全可控的企业级大数据集群云服务,轻松运行Hadoop、Spark、HBase、Kafka等大数据组件。具体部署方法可参考MRS官网文档。
资源未打标签 该反模式是指云资源未正确打标签,导致资源管理困难,增加了查找、监控和管理的复杂性。 优化建议:所有创建的云资源都要打好标签,方便后续的运维管理和成本优化。
图1 资源标签示例 华为云提供的标签管理服务(Tag Management Service,简称TMS)是一种快速便捷将标签集中管理的可视化服务,提供跨区域、跨服务的集中标签管理和资源分类功能,为客户提供统一的控制台与API接口,并最终实现用户对资源的使用权限、计费与管理高效结合。
云安全则借助于云服务商提供的丰富安全工具和服务,如身份与访问管理(IAM)、虚拟防火墙、安全组、加密服务等,支持自动化和可编程的安全管理,能够快速响应和调整安全策略,提高了安全管理的效率。