研究方向
研究方向
负责混合云基础服务计算、网络竞争力构建。突破混合云下一代计算和网络关键技术,使能跨云跨池网络流量安全治理,数据快速平稳流转、极致算力调度,大幅提升全栈云资源利用率,联合高校、周边Lab等组织开展计算、网络领域合作创新,构建差异化竞争力。
对海量云上资源监控数据进行ML建模分析,通过模型训练建立云上负载特征模型,孵化基于资源使用趋势和特征的智能决策系统。根据不同应用场景,对算法进行优化,支撑资源调度系统完成全局资源优化。
针对混合云场景应用多样、集群庞大、资源负载低等特点,构建新一代算力智能调度系统。关注资源统一、应用QoS、实例间干扰、业务特征等深层次影响资源使用效率的问题,进行相关关键技术的突破,实现资源高效利用。
在多云多池场景下,面向应用构筑全域网络,支持应用无感自动互联,简化服务到服务的连接、安全和可观测,支撑全域应用发布和跨区域流动。
负责混合云领域全栈运维竞争力构建。从数据采集、数据治理、数据分析、数据决策维度持续优化运维能力,突破非侵入可观测、统一监控模型、日志/时序异常检测、基于OpsLLM智能根因诊断等关键技术,实现混合云全栈运维,支持故障1分钟发现,5分钟定界,10分钟恢复。
结合eBPF和JavaAgent技术,兼容开源生态,构建高性能、低成本、无侵入的数据采集能力,标准化混合云可观测数据模型;孵化高效、实时、开放的可观测平台能力,构建物理和逻辑全链路拓扑,支撑混合云全场景运维。
通过日志异常检测算法从海量日志中识别关键异常点,构建智能日志分析系统,充分挖掘日志价值;结合时序异常检测算法从多维度监控指标中智能识别异常波动,支撑业务视角智能根因诊断。
构建基于混合云专业运维文档、历史故障工单的大模型辅助高精度智能问答能力;针对ChatOps运维场景研究NL2API、NL2SQL技术的应用,提升运维数据查询体验和效率;研究LLM辅助的智能运维多Agent协同调度技术。
负责华为云批量解决方案创新竞争力构建。聚焦模型驱动站点/云服务生命周期管理,基于MBSE建模理论,以开发者集成体验为中心,持续沉淀批量交付能力,实现站点数字孪生技术,支持海量站点信息持续运营与演进。
面对站点、云服务、底层硬件等规模日益增大,复杂度不断增加的云系统,基于仿真和数字孪生技术,解决站点收编不可视、升级变更不可靠、环境不可视、组合验证场景多等问题,提升站点治理能力及环境获取和使用的SLA,实现站点/云服务生命周期的高效管理,环境的批量管理和复制能力。
为了提升复杂云系统的稳定性、可靠性、效率和智能化程度,引入MBSE对云系统分层建模,构建全面模型库,通过仿真等方式验证模型的正确性。结合数字孪生技术,实现实时数据同步、健康监控、预测故障、智能决策等,提升云系统的可用性。
-
基础设施
负责混合云基础服务计算、网络竞争力构建。突破混合云网络和数据边界,使能跨云跨池网络流量安全治理,数据快速平稳流转、极致算力调度,大幅提升全栈云资源利用率,联合高校、周边Lab等组织开展计算、网络领域合作创新,构建差异化竞争力。
-
智能运维
负责混合云领域全栈运维竞争力构建。从数据采集、数据治理、数据分析、数据决策维度持续优化运维能力,突破非侵入可观测、统一监控模型、日志/时序异常检测、基于OpsLLM智能根因诊断等关键技术,实现混合云全栈运维,支持故障1分钟发现,5分钟定界,10分钟恢复。
-
系统工程
负责华为云批量解决方案创新竞争力构建。聚焦模型驱动站点/云服务生命周期管理,基于MBSE建模理论,以开发者集成体验为中心,持续沉淀批量交付能力,实现站点数字孪生技术,支持海量站点信息持续运营与演进。