检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
多云战略的驱动力 当前多云战略正在成为一种主流趋势,越来越多的组织选择将业务系统部署在多个云服务商的云平台上,而不是依赖单一的云服务商。这种趋势的背后是多种因素的驱动,以下是一些主要的驱动力: 避免单云故障:将业务部署在单一云平台上存在单点故障风险。如果该云平台出现故障,例如大规
确保容器可以与其他容器、数据库、消息队列等进行交互,并确保数据持久性和可靠性。 安全性和监控:确保容器化环境的安全性,例如限制容器的权限、使用安全的镜像源、进行漏洞扫描等。同时设置监控系统,以便实时监测容器的性能和运行状态。 测试和部署:在容器化改造完成后,进行全面的测试,包括
定需求。 基于上述优缺点分析,集中化运营模式适合稳态的业务系统,这些业务系统的更新频率比较低,例如企业采购的SAP等商业软件,或者企业自研的进入成熟期的业务系统。集中化运营模式也适合那些由IT部门统一建设和运维的业务系统。 父主题: 云运营模式
M服务进行协同,可以统一接入其他账号下的各个云服务的监控指标数据,并在运维监控账号中统一查看这些指标数据,在此基础上进一步统一配置告警规则。具体实施步骤请参考通过多账号聚合Prometheus实例实现指标数据统一监控。 运维监控账号中的COC服务当前可以统一纳管其他账号下的云资源
单元的故障或安全问题可能会影响到其他业务单元,甚至整个系统。而通过将不同的业务单元部署在独立的云账号中,企业可以有效地隔离故障和风险,防止问题的扩散。举个例子,如果某个业务系统遭遇了安全攻击,攻击者可能只能够接触到该业务系统所在的云账号中的资源,无法进一步影响到其他业务单元。这种
检查ELK日志平台,是否能承受大量应用启动时产生的大量日志 是 否 告警监控系统检查 运维团队 监控系统是否正常 是 是 磁盘无用信息清理 运维团队 生产环境检查磁盘使用情况,提前执行脚本批量清理磁盘 是 是 操作指导书、工具、终端和登陆平台准备 通知全员更新到最新的Runbook 项目经理 同步最新生产R
MRS是一个在华为云上部署和管理Hadoop系统的服务,一键即可部署Hadoop集群,完全兼容开源接口,轻松运行Hadoop、Spark、HBase、Kafka、Storm等大数据组件,并具备在后续根据业务需要进行定制开发的能力,帮助企业快速构建海量数据信息处理系统。详细信息请参考官网文档。 数据湖探索(Data
应用和数据库进行告警监控等的观测,确保源端告警清理,状态均正常。 目的端检查:通知云厂家进行资源日常状态的巡检和高可用性检查。另外目的端切换后就是正式生产环境,要确保告警、监控、日志、安全策略均已完成配置并做最后一次检查和确认。 正向迁移任务的状态检查:系统切换前通常迁移任务已经
IT管理系统:为了支撑业务系统的长期安全稳定运行所建立的IT支撑和管理系统,如安全运营中心、IAM和监控运维系统等。 子系统:大型业务系统或IT管理系统通常包含多个相互解耦且相互关联的子系统、功能模块或微服务,这些子系统相互协作,共同实现整体系统的功能。 功能小组:参与业务系统或IT
相关性原则:不需要把企业内部的完整组织架构映射到华为云上,只把那些负责管理IT系统的组织单元(如部门、分公司)和使用IT资源的用户映射到华为云上。如行政部门不管理、不查看、不操作任何云上IT资源,就不需要在华为云上创建一个对应行政部门的组织单元;如财务小张不负责IT系统的成本核算、分析和预算管理,就无需为小张在华为云上创建一个拥有财务管理权限的用户。
切换时出现问题。 优化建议:在正式切换前进行全面的切换演练,模拟真实环境中的不同场景,及时发现并解决问题,确保系统在切换后能正常运行。 测试不充分 该反模式是指业务系统切换前测试不充分,导致潜在问题未能及时发现和解决,上线后出现各种功能、性能、安全性等问题,影响用户体验。 优化建
测试和验证:在将集成应用投入生产之前,进行全面的测试和验证。确保新旧应用之间的数据传递和功能调用正常工作,并且没有任何破坏或冲突发生。 监控和维护:一旦集成应用上线,建立监控机制来跟踪集成环境的运行情况。监控包括应用性能、接口可用性和数据一致性等方面。及时处理任何异常情况,并定期进行维护和优化。 父主题: 应用现代化
安全防护三分在于技术,七分在于运营。只有不断优化安全管理流程、持续安全运营、持续监控和评估云环境的合规性,才能保障业务系统的长期安全稳定运行。 木桶原则(Barrel Principle) 安全是一项系统工程,适用木桶原则,任何一项安全短板都会降低整体安全性,因此要避免安全短板的出现。
时完成。 数据应用: 大数据平台的最终目的是为业务提供有价值的数据应用。数据应用可以是基于大数据分析的实时报表、可视化仪表盘、智能推荐系统、欺诈检测系统等。通过将大数据的分析结果与业务流程集成,可以实现数据驱动的业务决策和创新。 父主题: 大数据架构设计
周期和按需资源的比例,定期监控资源使用情况,持续优化调整。 设计存在单点故障 架构设计时未考虑高可用性,导致关键组件成为单点故障,一旦发生故障,整个系统将无法正常工作。 优化建议:实现冗余设计,采用负载均衡策略,确保应用的关键服务在多节点上运行,提升系统的可靠性和可用性。 架构设计未考虑业务的地理分布
企业云化转型最核心的工作就是将支撑企业生产和运营的各种应用系统云化。首先,最基本的要求是保障应用系统可以在云平台上长期安全稳定运行;其次,要让应用系统可以充分利用云计算的优势提升应用系统的质量,如提升应用系统的韧性、敏捷性、安全性和性能等,最后,应用系统生于云、长于云,可以基于云平台提供的新技术
切换。 保障:业务切换后进行一段时间的实时监控和特别运维保障。 调研 应用迁移小循环需要调研的信息主要集中在单个应用级别,前面阶段获取的调研信息可以复用。 本阶段主要是“由粗到细”打开到能够指导迁移实施的详细程度。 调研方法请参考应用系统调研的内容,需要调研的内容包括应用的技术架构、详细的组件信息。
具备项目管理能力,能够推动跨部门的协作和变革。 IT部门内部培养或者外聘 云成本运营工程师 监控和分析云资源的使用情况,识别成本节约机会。 生成详细的成本分析报告,为决策提供数据支持。 与云运维团队和应用团队合作,优化应用系统的成本效益。 实施成本优化策略,例如改变计费模式、购买资源包、关闭闲置资源等。
Zone 为了实现业务单元的安全和故障隔离,华为云的推荐做法是将不同业务单元的应用系统分别部署在不同的账号中。华为云账号具备以下三个属性。 华为云账号是一个资源容器,用户可以在其中部署任意云资源和上层业务应用系统,不同的账号相当于不同的资源容器,账号之间是完全隔离的。因此在一个账号中的故障和安全风险不会影响和传播到其他账号。
缩略语 表1 缩略语(按照字母顺序) 缩略语 英文全称 中文全称 AIOps Artificial Intelligence for IT Operations 智能运维 AOM Application Operations Management 应用运维管理服务 ALM Application