检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
智能运维工具能够提高运维工作的效率和质量,降低人力成本。尤其是AI 时代,通过引入自动化、智能化等技术手段,团队可以更加高效地管理和维护系统,有几个原则: 选择合适的工具和技术,确保其与业务需求和技术栈相匹配,如自动化部署、故障预测、智能定界定位等。 将工具与现有系统进行整合,根据实际需求进行定制和优化,以满足特定的运维需求。
SQL类: 常用于Hive、Spark、UDF等 Python类:常用于Spark、算法场景等 其他类:如Shell、Scala等,多用于脚本调用 任务数量 调研各类任务的总数量,用于评估任务迁移周期及改造工作量。如:XX调度平台下,Jar任务XX个。 任务更新周期 识别出不同调
应用迁移上云 应用迁移上云简介 设计迁移方案 设计切换方案 设计Runbook 部署 迁移 验证 切换 保障 父主题: 采用实施
应用系统调研 调研应用全景图 调研应用部署架构 调研应用关联关系 调研应用上云需求 父主题: 调研评估
大数据迁移 调研 设计 部署 迁移 验证 切换 保障 父主题: 采用实施
优化计费模式与节省成本 华为云提供计费模式的优化建议,帮助企业在不改变资源性能的情况下,通过调整计费模式来节省成本。 按需转包年包月成本优化评估:自动识别客户长期按需使用的资源(比如云主机、云硬盘、RDS数据库),按需转包周期的转换建议和节省评估。客户可重点关注高节省低风险的节省建议(“
修复。 验证作业执行结果的一致性 验证大数据任务执行结果的一致性,对比新旧大数据平台的作业输出结果数据是否一致。可以使用对比工具、数据校验脚本或手动检查的方式进行验证。如果发现数据不一致的情况,可能需要考虑迁移过程中的数据转换、数据格式或数据处理逻辑的问题,并进行相应的修复和调整。
采用实施 概述 组建实施团队 基础设施部署 应用迁移上云 大数据迁移 应用现代化 云上创新 采用实施的反模式
安全运营账号 作为企业安全运营中心,统一管控整个企业内所有账号的安全策略、安全规则和安全资源,为成员账号设置安全配置基线,对整个企业的信息安全负责 安全管理团队 统一部署具备跨账号安全管控的服务,如安全云脑SecMaster、企业主机安全HSS、数据安全中心DSC、数据加密服务DE
境进行集中化的IT治理。CCoE团队赋能应用团队全权负责业务系统所需云资源的部署和运维,这样既可以减轻CCoE团队的负担,又可以提升应用团队的自主性,进一步提升应用系统的敏捷性。为避免各业务单元独立部署和运维云资源带来的标准不统一问题,CCoE团队需要制定相应的IT治理策略强制各
个操作失败可能影响多个组件或服务。因此,云上操作风险处理通常建议采用自动化的方式进行,尤其在业务系统割接上线的环节,尽可能减少人为带来的误操作风险。简而言之,能脚本化、自动化的就不手工操作,能工具化的就不用脚本操作,全面消除人为操作风险。 云化转型的项目管理对安全要求较高,如针对
新功能需求绑定大版本上线,需求交付周期长(年/月级) 快速迭代上线,交付周期缩短(周/天级) 团队规模大,传统开发模式 团队拆小,DevSecOps敏捷运作 物理服务器 容器化部署、全面上云 应用现代化不只是采用云原生技术(如容器、微服务、DevOps、API网关等),还包括新技术(如AI、数字人、IoT、区块链等)
安全配置基线 安全配置是信息系统的最小安全保障,云安全配置是云环境最基本的安全保证,是开展安全防护和安全运营的基础。 如果云服务没有达到安全配置基线要求,云上业务及资产将面临巨大安全风险。为了帮助客户提高云环境的安全防护能力,华为云为客户提供了华为云安全配置基线指南。该指南包括身
Runbook执行步骤要尽量细化,确保每个执行步骤对应1个操作人和1个确认人,尽量避免发生1个步骤多个人确认的场景。 Runbook要细化到每个执行命令,尽量脚本化或工具化,操作人直接执行即可,不需要现场临时定制,避免出现人为事故。 Runbook步骤中有并行操作和串行操作,要标记好串并行顺序,避免人为操作不当影响切换时长和切换结果。
将计算、存储、网络和其他基础设施资源以云服务的形式提供给用户,用户基于这些云服务可以部署和运行任意软件,其中可能包括操作系统、数据库、中间件和应用程序。用户不控制底层云基础设施,但可以控制操作系统、存储、部署的应用程序以及可能的有限的网络组件(例如主机防火墙)。 PaaS PaaS 将
提供云上资产管理、安全态势管理、安全信息和事件管理、安全编排与自动响应等能力,可以鸟瞰整个云上安全,精简云安全配置、云防护策略的设置与维护,提前预防风险,同时,可以让威胁检测和响应更智能、更快速,帮助您实现一体化、自动化安全运营管理。关于SecMaster服务的详细功能和详细使用方法,请参考官网帮助文档。
容器镜像库等,也可以是CodeArts等PaaS服务。 负责集中部署和维护这些公共IT服务,并将其共享给公司内所有业务单元使用。 保障公共IT服务的安全稳定运行。 熟悉主流云平台的IaaS和PaaS服务,并能熟练部署这些服务。 熟悉云平台之上实现资源共享的技术方案,如基于网络的共
anding Zone,部署可扩展的网络基础设施,配置安全基线和运维基线;然后将各个应用系统和大数据平台迁移或直接部署到云上,或者基于云平台进行应用现代化改造,也可以基于云平台提供的各种创新技术直接在云上进行应用和业务创新。 运维治理:将应用系统迁移或部署到云上之后就进入了运维治
责制定云标准、最佳实践和治理框架,协调各业务单元之间的合作,确保云化转型的高效推进。此外,应用生命周期管理流程也需要进行变革,传统的开发和部署模式难以适应云环境的快速迭代需求,引入敏捷开发、DevOps等先进方法,可以提高开发效率,缩短交付周期,提高对市场变化的响应能力。 在平台
ig、Flink等。 调研任务调度平台支持的任务类型,包括Jar类任务、SQL类任务、脚本类任务(Python、Shell)等。 调研任务调度平台是否提供可视化和管理界面,以方便任务调度的配置、监控和管理。 了解任务调度平台的容错机制,包括任务失败后的重试机制、故障恢复策略等。 调研数据流: