检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
运维监控账号需要运维第三方云和本地DC中的资源; 安全运营账号需要到公网获取系统补丁包; 数据平台需要获取第三方云和本地DC的数据; DevOps账号需要从Github下载代码,需要将软件制品部署到各个业务账号; 公共服务账号需要与本地IDC互联; 生产、开发、测试环境要求网络隔离
网络服务选型 华为云提供的网络服务有虚拟私有云VPC、企业路由器ER、企业交换机ESW、云专线DC、虚拟专用网络VPN、全球加速GA、弹性负载均衡ELB、NAT网关、弹性公网IP等。
调研任务调度平台支持的任务类型,包括Jar类任务、SQL类任务、脚本类任务(Python、Shell)等。 调研任务调度平台是否提供可视化和管理界面,以方便任务调度的配置、监控和管理。 了解任务调度平台的容错机制,包括任务失败后的重试机制、故障恢复策略等。
什么是平台工程 平台工程(Platform Engineering)是一种通过构建和运营自助式内部开发平台(IDP,Internal Developer Platform)来优化软件交付和生命周期管理的工程学科。
建立完善的监控和运维机制 为了保障平台和应用的稳定运行,需要建立覆盖基础设施、平台服务和应用层面的监控和运维机制。您可以利用应用运维管理服务(AOM),集中监控微服务的性能指标,如响应时间、错误率和调用次数等,帮助快速定位和解决问题。
平台工程 什么是平台工程 如何构建平台工程 父主题: 顶层规划
保障 在上云迁移的保障阶段,需要执行以下任务来确保顺利过渡到新的云环境: 云平台监控:确保建立有效的监控系统,跟踪云平台的性能、可用性和安全性。设置警报机制,及时发现并解决潜在的问题。 系统监控和运维:设置系统监控和告警,确保及时发现和解决潜在的问题。
IT部门 云网络管理员 负责云平台网络架构的设计、配置和日常运维,保障网络稳定和安全。 管理VPN、专线、VPC、子网、网络ACL、路由、负载均衡、防火墙等网络组件。 监控网络性能,排查网络故障,优化网络延迟和带宽使用。 确保网络安全,防范DDoS攻击等网络威胁。
SLA(Service Level Agreement)和供应商支持关系 检查既有的 SLA 和供应商支持协议,并评估迁移到云平台后对这些关系的影响。确保在云环境中依然能够满足业务需要并获得期望的支持和服务。 网络和连接依赖关系 调研目标应用所需的网络连接和传输协议。
网络和存储配置:配置容器之间的网络通信和访问外部资源的方式。确保容器可以与其他容器、数据库、消息队列等进行交互,并确保数据持久性和可靠性。 安全性和监控:确保容器化环境的安全性,例如限制容器的权限、使用安全的镜像源、进行漏洞扫描等。
熟练使用云平台的安全运营服务和各种安全监控工具。 掌握威胁检测技术、漏洞扫描工具和补丁管理流程。 熟悉日志分析工具和自动化脚本语言(如Python、Shell)。 了解云平台的安全配置(如安全组、防火墙规则)。 具备快速响应和处理安全事件的能力。 IT部门 父主题: 云卓越中心
如下图所示,可信身份从互联网(不可信网络)访问云资源的请求会被拒绝,不可信身份通过本地数据中心网络(可信网络)访问云资源的请求也会被拒绝,可信身份访问其他企业的对象存储桶(不可信资源)的请求还会被拒绝,只有可信身份通过本地数据中心网络(可信网络)访问本企业的云资源的请求是允许的。
基础环境在业界也叫做LandingZone(着陆区),基础环境设计包括6个方面,即账号和权限设计、整体网络设计、整体安全设计、资源治理设计、运维监控设计、财务管理设计。
保障:业务切换后进行一段时间的实时监控和特别运维保障。 请参考大数据调研的调研方法,调研大数据集群、大数据任务调度平台和大数据应用的现状信息。 父主题: 大数据迁移
该指南包括身份与访问管理、日志与监控、虚拟机与容器、网络、存储、数据库、企业智能等方面的安全配置,但并不是所有可能的安全配置的详尽列表。建议您将该指南作为一个起点,并根据实际需要在此基础上进行补充或裁剪。
提升资源弹性 资源弹性是云计算的核心特性之一,是指云平台能够根据业务需求,按需对业务系统所需的计算、存储和网络等资源进行快速扩容和缩容。提升资源弹性可以有效提升业务敏捷性和业务连续性。
保障 在大数据迁移的保障阶段,需要执行以下任务来确保顺利过渡到新的云环境: 监控和警报设置:建立实时监控系统,监测集群、任务调度平台和应用程序的运行状态。设置警报,以便及时发现潜在的问题并采取措施。 优化集群性能:对大数据集群进行性能评估和调优。
企业需要建立统一的安全管理平台,整合各类安全信息,提升全局防护能力,才能应对当前的安全挑战。 安全专家稀缺 安全专家的稀缺已成为制约企业安全运营的一大瓶颈。首先,受投资有限的影响,许多企业无法组建庞大的安全团队,专业的安全人才不足。
所有账号下中间件资源的管理权限 所有其他账号下的运维监控服务(AOM,CES,APM等)的管理权限 自动化运维组 统一监控和运维各个账号下的资源 运维监控账号的Tenant Administrator权限 所有其他账号下的运维服务COC的管理权限 数据管理组 集中部署和管理企业数据平台
图3 规划IT管理账号的模式 模式1是全量规划,针对大型IT组织,这些IT组织通常有数十上百个IT管理人员,内部已经按照安全运营、日志审计、网络运营、运维监控、公共服务、数据平台、DevOps等职责划分了独立的IT职能小组。