检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云上创新 概述 人工智能 大数据 区块链 元宇宙 物联网 父主题: 采用实施
切换到其他可用的AZ上,以快速恢复服务,企业可以利用容器编排工具、自动化脚本或云服务提供商提供的故障转移功能来实现自动故障恢复。 监控和警报:设置监控和报警机制,实时监测每个AZ中的应用程序和基础设施的健康状态,在发生故障时,及时触发告警,并通知有关人员进行故障排查和处理,以减少服务中断时间。
高性能计算、企业核心集群应用、企业应用系统和开发测试等 高性能计算、媒体处理、文件共享和内容管理和Web服务等 大数据分析、静态网站托管、在线视频点播、基因测序和智能视频监控等 存储逻辑 存放的是二进制数据,无法直接存放文件,如果需存放要先格式化文件系统 存放的是文件,会以文件和文件夹的层次结构来整理和呈现
立了适合云环境的工作流程。 数智赋能 主要评估组织在大数据和人工智能领域的能力水平,是否能够利用云平台的数智化服务,实现数据驱动的业务创新和智能化转型,衡量组织的数据生命周期管理、数据治理能力,以及在人工智能技术(如AI开发、大模型等)方面的实践水平。 应用现代化 主要评估组织的
持续分析和监控云成本,识别节约机会,避免过度配置或闲置资源,从而提高投资回报率和财务效率。 卓越运营支柱 卓越运营支柱关注高效地运营和监控系统,持续改进流程并交付业务价值。它强调实践DevOps、基础设施即代码、自动化部署、测试验证和自动化运维任务,建立全面的监控、日志记录和告
主机安全服务(Host Security Service,HSS)是以工作负载为中心的安全产品,HSS通过对主机、容器进行系统完整性的保护、应用程序控制、行为监控和基于主机的入侵防御等,保护工作负载免受攻击。HSS不受地理位置影响,为主机、容器等提供统一的可视化和控制能力。关于HSS服务的详细功能和详细使用方法,请参考官网帮助文档。
T资源。 降低运维成本: 云服务商负责IT 基础设施的维护和管理,企业无需投入大量人力和资金进行IT基础设施的日常运维。而且云平台提供了智能监控系统和自动化运维系统可以大幅提升应用系统的运维效率,企业可以减少在应用系统运维领域的人力投入,进一步降低了运维人力成本。自动化运维也降低了人为错误的风险,从而减少纠错成本。
M服务进行协同,可以统一接入其他账号下的各个云服务的监控指标数据,并在运维监控账号中统一查看这些指标数据,在此基础上进一步统一配置告警规则。具体实施步骤请参考通过多账号聚合Prometheus实例实现指标数据统一监控。 运维监控账号中的COC服务当前可以统一纳管其他账号下的云资源
础设施的可重复性、版本控制和自动化部署,从而提高整个环境的稳定性和可靠性。 集中日志和监控:通过集中管理日志和监控数据,可以实时了解系统运行状况,并及时发现和解决问题。选择适当的日志管理和监控工具,并定义关键指标(KPIs)和警报规则,以确保系统的可用性和性能。 容器化和微服务架
性。 实施监控和日志记录: 对于微服务架构,实施全面的监控和日志记录是非常重要的。使用适当的监控工具和日志系统,收集和分析每个微服务的指标和日志,以及整体系统的性能和故障信息。这将帮助您快速发现和解决潜在的问题,并保证系统的可用性和稳定性。您可以利用云提供商所提供的监控和日志服务
测试和验证:在将集成应用投入生产之前,进行全面的测试和验证。确保新旧应用之间的数据传递和功能调用正常工作,并且没有任何破坏或冲突发生。 监控和维护:一旦集成应用上线,建立监控机制来跟踪集成环境的运行情况。监控包括应用性能、接口可用性和数据一致性等方面。及时处理任何异常情况,并定期进行维护和优化。 父主题: 应用现代化
实现运维自动化,降低人力成本。 提升系统的可用性和可靠性,支持业务连续性。 基于云平台的特点制定云运维流程和标准。 推广云运维工具的使用,实现自动化和智能化。 培训运维团队,提升云运维技能。 应用架构师 优化应用架构,提升系统性能、可扩展性和可靠性。 支持应用现代化,充分利用云服务的优势。
所有其他账号下的运维监控服务(AOM,CES,APM等)的管理权限 PaaS管理组 也叫中间件管理员,统一管理各个账号下的中间件资源 所有账号下中间件资源的管理权限 所有其他账号下的运维监控服务(AOM,CES,APM等)的管理权限 自动化运维组 统一监控和运维各个账号下的资源 运维监控账号的Tenant
缩略语 表1 缩略语(按照字母顺序) 缩略语 英文全称 中文全称 AIOps Artificial Intelligence for IT Operations 智能运维 AOM Application Operations Management 应用运维管理服务 ALM Application
不断迭代的方法,使用数据驱动来优化资源类型和配置选项的选择; 性能度量 设置性能度量和监控指标,以捕获关键的性能指标; 使用可视化技术呈现性指标和性能问题(如:异常状态、低利用率等); 性能监测 确定监控范围、度量和阈值; 从多个维度创建完整视图; 性能权衡 在架构中进行折中以提高性能,例如使用压缩或者缓存技术等。
式。确保容器可以与其他容器、数据库、消息队列等进行交互,并确保数据持久性和可靠性。 安全性和监控:确保容器化环境的安全性,例如限制容器的权限、使用安全的镜像源、进行漏洞扫描等。同时设置监控系统,以便实时监测容器的性能和运行状态。 测试和部署:在容器化改造完成后,进行全面的测试,包
明确业务需求:从业务角度出发,明确云化转型的具体需求和期望,例如提升业务连续性、业务敏捷性、增加收入等。 审批和监控预算:负责审核和批准云化转型相关的预算,并监控预算执行情况,确保资金的合理使用和成本的有效控制。 人力资源管理:负责CCoE成员的招聘、选拔、培养和留任,打造一支稳定和高绩效的CCoE组织。
业务部门 应用运维管理员 负责云上业务系统的部署、监控和维护,确保业务系统的安全稳定运行。 处理应用运行中的故障,优化应用性能。 配合开发团队进行应用的版本更新和发布。 监控应用日志,分析并解决潜在问题。 熟悉云平台的APM服务,具备应用性能监控和日志分析能力。 掌握CI/CD工具和容器
评估是否需要进行带宽的扩容,其次,对源端应用和数据库进行告警监控等的观测,确保源端告警清理,状态均正常。 目的端检查:通知云厂家进行资源日常状态的巡检和高可用性检查。另外目的端切换后就是正式生产环境,要确保告警、监控、日志、安全策略均已完成配置并做最后一次检查和确认。 正向迁移
为了支撑应用系统的长期安全稳定运行所建立的IT支撑和管理系统,如安全运营中心、IAM和监控运维系统等。 云服务 是指云服务商通过互联网或专有网络提供的各种IT服务,包括计算、存储、网络、安全、运维管理、数据库、中间件、大数据处理和AI等。用户可以按需访问这些服务,而无需自行购买和维护物理硬件和软件基