谐云云监控平台软件(HCS版)-
国家电网
一、建设背景:
国网业务上云是趋势,规模越来越大,依据各省情况不同,存在容器云/阿里云/华为云等云平台。
微服务(微应用)在国网 信息化 建设中应用广泛。
二、客户痛点:
1. 云上业务运行状态感知弱:现有监控手段对云上业务的运行状态无法形成全方位感知,难以构建云上业务全链路拓扑和业务系统画像,对业务健康运行的监管能力弱。
2. 云上业务故障定界困难:云上业务故障来自于业务所依赖的多个应用程序或不同应用程序之间的复杂交互,缺少有效的链路追踪与请求回溯能力,难以快速定界故障源头。
3. 云上业务缺少统一调控平面:针对容器云/阿里云/华为云上的资源及业务运行情况,缺少统一的监控平面,以业务的视角构建对业务运行健康情况与资源使用情况的调度监控能力。
三、建设内容:
1. 提高调控中心对业务运行状态感知能力,通过平台业务拓扑图可以仿真业务操作场景和流量情况,可以构建对业务健康情况的精准感知和分析能力;
2. 协助调控中心完成资源信息采集和基于业务画像的动态容量评估,可以有效识别并管理信息与业务部门的资源使用量和资源申请情况,为业务资源瘦身健体提供科学决策依据;
3. 平台可以自动识别新增应用及应用运行变化,可以解决传统只能通过人工通知更新的情况,避免部门间信息同步遗漏或出错,信息变化可以及时感知响应;
4. 国网调控中心作为信息通信的调度监控中心,可以通过平台实现对业务健康运行的监控感知和决策指挥能力,通过调控中心识别并快速定界问题,提供完整的业务指标信息和链路情况,并交由方式班或信息/业务部门处置,加强调控话语权,同时加深不同班组之间的配合;
5. 构建健康度分析模型,实时掌握业务健康状态,实现系统异常预警,避免遗漏低风险问题;
6. 平台信息采集通过独立运行,可以采集其宿主机上所有相关信息,对业务运行无干扰。
浦发银行
一、建设背景:
面对数字经济的兴起,浦发银行全力推动金融服务的“ 数字化 、智能化”,以“打造一流数字生态银行”的战略目标为指导原则,浦发银行开展了一系列云转型工程的建设, 云原生 微服务、容器、DevOps技术均在浦发的数智化云转型过程中扮演重要角色,而容器技术作为整个云原生架构的重要基石,在浦发云转型过程中的投产规模已经不容忽视,如何应对后续不断扩大大规模”应用上云“和“业务保障”成为云转型过程中新的挑战。
二、客户痛点:
1. 如何实现复杂分布式架构下进行微服务和微服务之间的故障快速定界
2. 缺乏有效工具支撑容器团队进行业务故障和平台问题的问题定界、业务故障和网络问题的定界
3. 数字化报表管理能力弱,目前主要由手动方式实现
4. 缺少统一视角观测容器集群资源使用情况,资源扩容规划成为新的挑战
三、建设内容:
1.通过平台业务拓扑图和全局租户(项目组)拓扑图定界视图,提高上云业务组和容器组对业务动态运行关系的感知能力和业务 故障排查 效率。
2.通过平台补充容器云DNS解析、包追踪、握手、网络流量和传输性能等网络方面的指标,进一步提升上云业务组和容器组对应用问题和网络问题的定界能力以及平台网络和二层网络问题的定界能力。
3.提高容器底座团队对集群可用性的感知能力,通过平台集群组件异常情况、集群资源使用情况、集群告警情况、集群业务健康情况让容器底座团队对容器集群整体可用性状态有实时感知能力和及时响应能力。
4.平台通过集成浦发CMDB的机房数据,构建数据中心、集群资源使用3D视图,通过3D模型可以了解机房资源使用情况、业务部署情况以及告警状态,同时通过仪表盘方式展示所有集群的cpu、内存等容量使用情况,可以为云转型进一步扩容提供容量规划的数据依据。
5.提高集群数字化管理能力,通过平台提供的台账报表功能,方便云转型部门领导了解业务上云的规模、容量以及云环境的资源使用情况。