检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
一个AZ发生故障时,自动将应用程序切换到其他可用的AZ上,以快速恢复服务,企业可以利用容器编排工具、自动化脚本或云服务提供商提供的故障转移功能来实现自动故障恢复。 监控和警报:设置监控和报警机制,实时监测每个AZ中的应用程序和基础设施的健康状态,在发生故障时,及时触发告警,并通知
环境: 云平台监控:确保建立有效的监控系统,跟踪云平台的性能、可用性和安全性。设置警报机制,及时发现并解决潜在的问题。 系统监控和运维:设置系统监控和告警,确保及时发现和解决潜在的问题。配置基础设施监控工具,监测服务器、存储、网络等关键指标,并确保日志记录和错误报警机制正常运行。
定时模式:创建定时任务,在指定时间执行资源扩缩容。 指标模式:基于资源的性能指标(如 CPU 利用率、网络流量均值)创建报警任务,当指标数据满足指定的报警条件时,触发报警并执行资源扩缩容。 固定数量模式:设置最小/最大期望资源数量,当实例数量低于下限/超过上限时,系统会自动添加/移出资源,使得资源数量等于下限/上限。
ManageEngine是一个应用程序管理器的工具。这是一个通用服务器和应用程序监控工具,它支持对服务器和数据库、虚拟机、应用程序、Web服务和其他组件的监控。 Datadog 商用 Datadog是一款具有应用程序监控和映射功能的性能监控工具。它可以在整个基础架构中收集信息,包括匹配特定客
Checklist记录了正式切换前需要准备和执行的操作,通常包括如下几个方面: 人员和场地准备 核对参与切换人员,并通知,包括内部人员和第三方配合人员通知和时间核对。 建立切换保障群,切换期间在保障群里进行切换相关公告和通知。 确定切换的具体日期、入场签到时间、操作开始时间。 切换场地的准备,如
云基础设施管理员 负责云平台上存储、虚拟机、操作系统等基础设施的日常运维管理。 监控和优化云资源的使用效率,确保资源分配合理。 处理虚拟机、存储和操作系统相关的故障,保障系统的高可用性。 定期进行系统补丁更新和安全加固。 熟悉主流云平台的虚拟机和云存储服务。 掌握Linux和Windows操作系统的管理与优化。
公共服务管理 首先您要识别出各个业务单元所需要的公共IT服务和资源,比如NTP服务器、SFS文件存储、自建DNS服务器、OBS桶、虚拟机镜像、证书等,也可以是CodeArts等PaaS服务。然后集中部署和维护这些公共IT服务,将其共享给公司内所有业务单元。华为云提供了三种资源共享的方式。
性。 实施监控和日志记录: 对于微服务架构,实施全面的监控和日志记录是非常重要的。使用适当的监控工具和日志系统,收集和分析每个微服务的指标和日志,以及整体系统的性能和故障信息。这将帮助您快速发现和解决潜在的问题,并保证系统的可用性和稳定性。您可以利用云提供商所提供的监控和日志服务
)进行有效沟通,确保项目信息透明,并获得各方支持。 风险管理: 识别、评估和管理项目风险,制定应急计划,并将风险最小化。 变更管理: 管理项目变更,确保变更得到适当的评估和批准,并对项目的影响最小化。 云项目经理是一个综合管理角色,不仅需要有扎实的项目管理能力,还要求具备一定的云
考源端策略配置目标端ELB负载均衡策略,具体部署流程,请参照华为云弹性负载服务ELB。 迁移到ECS上部署的软件负载均衡:如果源端是服务器上自建的负载均衡,迁移到华为云上仍然采用ECS自建负载均衡的场景,也可以使用SMS工具迁移。 VPN VPN需要在目标端华为云重新部署,具体部署流程请参照华为云虚拟专用网络VPN。
正式切换 正式切换的组织、准备和角色分工同切换演练基本一致,这里不再重复介绍。切换实施时,按照正式切换Runbook执行。不同业务系统的切换方案不同,对应的切换Runbook步骤也会不同,下面Runbook切换步骤仅供参考: 切换前准备和检查 正式切换前,先要按照Runbook Check
微服务架构:云平台天然适合微服务和容器化部署,支持应用拆分和独立扩展,提升灵活性和可维护性。 无服务器计算:云平台提供的无服务器计算服务(如 FunctionGraph)允许用户将代码部署到云端,而无需管理服务器。云平台会根据请求自动分配计算资源,并在请求处理完成后释放资源。这种模式极大地简化了扩展性管理。
承载的资源主要有: 虚拟机:在云上,虚拟机又叫做弹性云服务器(Elastic Cloud Server,ECS),是由CPU、内存、操作系统、云硬盘组成的基础的计算组件。弹性云服务器创建成功后,可以像使用自己的本地PC或物理服务器一样,在云上使用弹性云服务器。 容器:容器虚拟化技
云化转型后,企业无需管理IT基础设施,再借助云服务商提供的智能监控系统和自动化运维工具可以大幅提升IT运维效率。如果每个运维工程师可管理的服务器数量提升 2 倍,从100台提升至200台,假设企业总共有2000台服务器,每个运维工程师的年薪是20万元,那么每年总共可以节省200万
SC、数据加密服务DEW、云证书服务CCM、漏洞管理服务CodeArts Inspector 运维监控账号 统一监控和运维各个成员账号下的资源和应用,统一进行告警管理、事件处理和变更管理,并提供运维安全保障措施 运维团队 应用运维管理AOM、COC、云日志服务LTS、应用性能管理APM、云堡垒机CBH等
保障 在大数据迁移的保障阶段,需要执行以下任务来确保顺利过渡到新的云环境: 监控和警报设置:建立实时监控系统,监测集群、任务调度平台和应用程序的运行状态。设置警报,以便及时发现潜在的问题并采取措施。 优化集群性能:对大数据集群进行性能评估和调优。监视资源使用情况,优化配置参数、调整集群大小和资源分配,以提高整体性能。
持续分析和监控云成本,识别节约机会,避免过度配置或闲置资源,从而提高投资回报率和财务效率。 卓越运营支柱 卓越运营支柱关注高效地运营和监控系统,持续改进流程并交付业务价值。它强调实践DevOps、基础设施即代码、自动化部署、测试验证和自动化运维任务,建立全面的监控、日志记录和告
优秀的跨部门沟通、协作和问题解决能力。 IT部门 公共服务管理员 识别各个业务单元所需要的公共IT服务和资源,比如NTP服务器、AD服务器、自建DNS服务器、OBS桶、容器镜像库等,也可以是CodeArts等PaaS服务。 负责集中部署和维护这些公共IT服务,并将其共享给公司内所有业务单元使用。
负责云平台的日常安全监控与运维,及时发现并处理安全事件。 执行漏洞扫描、补丁管理和安全配置加固。 实施访问控制、权限管理和日志审计,确保系统合规性。 配合云安全专家完成安全技术方案的落地与优化。 编写安全运维脚本,提升安全运营效率。 熟练使用云平台的安全运营服务和各种安全监控工具。 掌握
产将面临巨大安全风险。为了帮助客户提高云环境的安全防护能力,华为云为客户提供了华为云安全配置基线指南。该指南包括身份与访问管理、日志与监控、虚拟机与容器、网络、存储、数据库、企业智能等方面的安全配置,但并不是所有可能的安全配置的详尽列表。建议您将该指南作为一个起点,并根据实际需要在此基础上进行补充或裁剪。