检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当前的云服务的安全配置是否满足基线要求,如果不满足,进一步按照指南提供的修复方法进行修复。您也可以使用华为云安全云脑提供的基线检查功能完成自动化检查。 父主题: 安全运营
快速变化的安全环境。为提升安全运营效率,企业需要引入先进的安全运营中心(SOC),利用大数据分析、机器学习等技术,实现告警的自动关联和优先级排序。通过自动化响应工具,加快事件处理速度。建立标准化的流程和协同机制,提高跨部门的响应效率。同时,加强对安全人员的培训,提高其分析和决策能力。
数据安全和权限管理:审查和加强数据的访问控制和权限管理机制。确保只有经授权的人员可以访问敏感数据,并采取适当的加密和脱敏措施保护数据安全。 自动化任务调度:确保大数据任务调度平台的运行和调度正常。优化调度策略,确保任务按时准确完成,并处理可能的故障或异常情况。 异常处理和故障恢复:
利用率、网络流量均值)创建报警任务,当指标数据满足指定的报警条件时,触发报警并执行资源扩缩容。 固定数量模式:设置最小/最大期望资源数量,当实例数量低于下限/超过上限时,系统会自动添加/移出资源,使得资源数量等于下限/上限。 手动模式:手动进行弹性伸缩,包括手动添加、移出或者删除已有的资源。 父主题: 可扩展性设计
优先推荐,华为云有技术支持 镜像导入/导出 OS不变,版本一致,停机时间长 - 重新部署:针对公有云的平迁方式的应用上云场景,我们建议使用CI/CD流水线构建自动化平台,然后在云上重新部署应用。 SMS工具迁移:是一种P2V/V2V迁移服务,可以帮您把X86物理服务器或者私有云、公有云平台上的虚拟机
编写安全运维脚本,提升安全运营效率。 熟练使用云平台的安全运营服务和各种安全监控工具。 掌握威胁检测技术、漏洞扫描工具和补丁管理流程。 熟悉日志分析工具和自动化脚本语言(如Python、Shell)。 了解云平台的安全配置(如安全组、防火墙规则)。 具备快速响应和处理安全事件的能力。 IT部门 父主题:
中间件层停服(消息消费完) 5~30 1、提前关停非核心业务,减少消息量 2、统一监控平台,减少检查时间 - - - 应用测试 15~60 1、测试用例自动化 2、只测试核心测试用例 数据层停服(停写检查) 5~10 1、统一监控平台,减少检查时间 - - - 流量切换 1~5 1、通过API接口调用或脚本批量操作,减少操作时间
目标架构设计时,未根据业务负载需求合理配置资源,导致资源过度分配或不足,从而增加成本或影响性能。 优化建议:根据业务需求和应用特点,选择合适的云资源规格,可以采用自动扩展策略,合理设置包周期和按需资源的比例,定期监控资源使用情况,持续优化调整。 设计存在单点故障 架构设计时未考虑高可用性,导致关键组件成
的AZ间时延,这种情况可以考虑单AZ部署,利用云服务主备、集群化部署模式来满足单个业务节点故障时快速恢复业务的需求,主要利用集群内节点故障自动探测和切换的方式来完成故障节点的恢复,消除业务单点,避免单点故障时业务受损。 双AZ(同城)高可用:对业务可用性要求比较高的业务,可以选择
优化计费模式与节省成本 华为云提供计费模式的优化建议,帮助企业在不改变资源性能的情况下,通过调整计费模式来节省成本。 按需转包年包月成本优化评估:自动识别客户长期按需使用的资源(比如云主机、云硬盘、RDS数据库),按需转包周期的转换建议和节省评估。客户可重点关注高节省低风险的节省建议(“
ess(无服务器)架构等技术,将应用拆分为能独立快速发布的不同模块,使开发运维人员能聚焦于应用和创新工作。 开发运维现代化,提升运维过程的自动化与安全性。通过建设以DevSecOps 为代表的开发运维安全一体化能力,让发布跟上开发的速度,让安全内置在开发运维中。 治理运营现代化,
参与制定云化转型团队的KPI,监督KPI达成情况。 运维主管 提高运维效率,减少故障和停机时间。 实现运维自动化,降低人力成本。 提升系统的可用性和可靠性,支持业务连续性。 基于云平台的特点制定云运维流程和标准。 推广云运维工具的使用,实现自动化和智能化。 培训运维团队,提升云运维技能。 应用架构师 优化应用架构,提升系统性能、可扩展性和可靠性。
生产数据。 执行测试用例:部分企业测试自动化起步较晚,大量用例仍需要人工执行,手工执行用例,在测试过程中需执行人详细记录测试时间、测试人员、用例执行结果等相关信息。部分企业已有自动化测试能力,上云过程中只需要将新增的用例增加到自动化平台自动执行。 输出测试报告:全部测试用例测试完成后,输出测试报告。
依据切换方案,将正向切换步骤细化到文档中,需要考虑到以下几个方面: 停服之前需挂停服公告,充分考虑用户感知。 停服操作需考虑系统的可用性机制,部分系统检测到应用停止会有自动拉起功能,所以需先关闭可用性机制,防止出现应用一直无法停止的风险。 数据库切换时需要考虑数据一致性问题,要想切换前后数据一致,必须源端的数
一的策略和工具,对全公司的云资源进行监控、监管和优化。例如,IT部门可以制定统一的安全策略,确保所有的云账号都符合公司的安全标准;可以通过自动化工具,对各个云账号的资源使用情况进行监控,及时发现和解决潜在的问题。这种分统结合的管理方式,在业务灵活性和中央管控之间达成了平衡。业务单
入,云化技术方案的设计可能无法满足业务场景,迁移过程也会因缺乏应用团队的配合而变得困难重重。更重要的是,应用团队的缺席会阻碍DevOps和自动化的推进,限制创新,最终导致云化转型无法带来预期的业务价值。 缺乏云治理专家:云治理专家如同云环境的“管家”,他们的缺失会导致云资源的使用
色和人员也较多,可以通过一次或多次演练,提高切换操作的熟悉度和各方的配合默契度以及问题处理的效率,对于一些操作时长比较长的步骤,还可以通过自动化脚本代替人工操作或者持续优化脚本提高执行效率,从而减少正式切换的中断时长。以某大型零售平台上云为例,采用所有业务系统一把切的方案,通过4
多账号统一安全管控功能,中心IT部门可以针对所有业务单元进行统一的安全运营,包括云上资产管理、安全态势管理、安全信息和事件管理、安全编排与自动响应等。集中化的安全管理可以确保安全策略的一致性,有效防范网络攻击和数据泄露,保护企业的核心资产。 集中合规审计:随着各类信息安全法规和行
务和平台高度集成,一个操作失败可能影响多个组件或服务。因此,云上操作风险处理通常建议采用自动化的方式进行,尤其在业务系统割接上线的环节,尽可能减少人为带来的误操作风险。简而言之,能脚本化、自动化的就不手工操作,能工具化的就不用脚本操作,全面消除人为操作风险。 云化转型的项目管理对
也叫中间件管理员,统一管理各个账号下的中间件资源 所有账号下中间件资源的管理权限 所有其他账号下的运维监控服务(AOM,CES,APM等)的管理权限 自动化运维组 统一监控和运维各个账号下的资源 运维监控账号的Tenant Administrator权限 所有其他账号下的运维服务COC的管理权限