检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
程和指南,推动云治理最佳实践的落地和执行。 确保云治理策略与业务目标对齐。 持续优化云治理框架,以适应不断变化的业务需求和技术发展趋势。 监控云环境的合规性和安全性。 深入理解云架构、云安全、云成本优化等方面的知识。 熟悉主流云平台的云服务和最佳实践。 具备丰富的风险管理、合规性管理和IT治理经验。
为了支撑应用系统的长期安全稳定运行所建立的IT支撑和管理系统,如安全运营中心、IAM和监控运维系统等。 云服务 是指云服务商通过互联网或专有网络提供的各种IT服务,包括计算、存储、网络、安全、运维管理、数据库、中间件、大数据处理和AI等。用户可以按需访问这些服务,而无需自行购买和维护物理硬件和软件基
Search Service,简称CSS) 基于Elasticsearch且完全托管的在线分布式搜索服务,为用户提供结构化、非结构化文本、以及基于AI向量的多条件检索、统计、报表。Elasticsearch是一个搜索引擎,可以实现单机和集群部署,并提供托管的分布式搜索引擎服务。在ELK整
务单元的应用团队需要关注应用层的安全防护,如防止SQL注入等;在成本管理方面,CCoE团队负责集中化的成本管理,包括集中化的成本计划、成本监控、成本分析和成本优化等,各业务单元的应用团队需要负责针对云资源打上成本标签。 图1 赋能和协同运营模式 赋能和协同运营模式兼具上述两种运营模式的优点:
集中网络管理 网络运营账号 共享服务管理 公共服务账号 统一安全管理 安全运营账号 统一合规审计 安全运营账号、日志账号 统一运维管理 运维监控账号 统一财务管理 主账号(管理账号) 数据边界 主账号(管理账号)、沙箱账号(用于测试各种控制策略) 组织与账号的设计方案在前面已经详细
独立运行,但IT部门可以通过统一的策略和工具,对全公司的云资源进行监控、监管和优化。例如,IT部门可以制定统一的安全策略,确保所有的云账号都符合公司的安全标准;可以通过自动化工具,对各个云账号的资源使用情况进行监控,及时发现和解决潜在的问题。这种分统结合的管理方式,在业务灵活性和
熟悉主流云平台的计费模式和成本管理工具。 熟悉常用的云成本优化方法。 具备项目管理能力,能够推动跨部门的协作和变革。 IT部门内部培养或者外聘 云成本运营工程师 监控和分析云资源的使用情况,识别成本节约机会。 生成详细的成本分析报告,为决策提供数据支持。 与云运维团队和应用团队合作,优化应用系统的成本效益。
帮助企业优化资源配置,提高成本效益。 充分利用不同厂商的优势能力:不同的云服务商在技术、服务和功能方面各有优势。例如,某个云服务商可能在人工智能和机器学习方面拥有更强的技术实力,而另一个云服务商可能在数据库服务方面更具优势。多云战略允许企业根据自身业务需求,选择最合适的云服务商及
迁移:将源端应用和数据迁移到云上目标环境。 验证:进行数据和业务验证。 切换:进行切换演练,刷新Runbook,实施正式切换。 保障:业务切换后进行一段时间的实时监控和特别运维保障。 调研 应用迁移小循环需要调研的信息主要集中在单个应用级别,前面阶段获取的调研信息可以复用。 本阶段主要是“由粗到细”打开到能够指导迁移实施的详细程度。
Intel g 搭载T4卡,图像加速 3D动画渲染、CAD p 搭载V100卡,计算加速 AI深度学习、科学计算 pi 搭载T4卡,推理加速 实时推理+轻量级训练 AI加速型 Intel ai 搭载昇腾310芯片,计算加速或推理加速 深度学习、科学计算、CAE ARM 鲲鹏通用计算增强型
测试、安全测试等,确保每个功能模块在云环境中能正常稳定运行。 资源未打标签 该反模式是指云资源未正确打标签,导致资源管理困难,增加了查找、监控和管理的复杂性。 优化建议:所有创建的云资源都要打好标签,方便后续的运维管理和成本优化。 通过识别和避免这些反模式,并参考行业最佳实践和成
后的作业性能是否符合预期。如果作业的性能有问题,可能需要调整作业的配置参数、优化作业代码或考虑资源调配的问题。 在作业验证过程中,可以使用监控工具、日志分析和数据校验等手段,确保迁移后的大数据任务的可靠性和稳定性。 父主题: 大数据迁移
可用性定义 可用性(Availability)是产品/服务在规定的条件下和规定的时刻或时间区间内处于可执行规定功能状态的能力,是产品可靠性和可维护性的综合反映。服务可用性一般会用SLA(Service-Level Agreement)来衡量,各类云服务都有承诺的SLA标准。不同SLA级别对应的停机时间如下表所示:
或项目组等)创建对应的子账号。 IT管理账号设计原则:针对IT部门,可以按照企业当前的IT职责划分不同的IT管理类子账号,如安全运营、运维监控、网络运营、数据平台等子账号。 父主题: Landing Zone设计
部署。 迁移:实施数据迁移和任务迁移。 验证:进行数据校验和任务验证。 切换:配合大数据应用进行切换。 保障:业务切换后进行一段时间的实时监控和特别运维保障。 请参考大数据调研的调研方法,调研大数据集群、大数据任务调度平台和大数据应用的现状信息。 父主题: 大数据迁移
弹性伸缩能力实现APP业务的水平扩展,随着负载增加,APP业务POD能自动扩展,随着负载的降低,APP业务POD自动减容,支持配套应用性能监控(AOM)实现告警策略自动触发扩容或减容; 若应用层使用ECS进行部署,则可通过华为云弹性伸缩服务AS,设置对应的伸缩策略,随业务实现水平扩缩容。
为实施团队提供技术支持和指导。 云基础设施管理员:来自IT部门的运维团队,负责管理云基础设施,建立和实施云运维流程,以支持云环境的管理、监控和优化。 云安全专家:来自信息安全部门或具有安全合规认证的专业人士,专注于云安全和合规,确保上云过程中遵循行业规范、法律法规和企业内部管理
降低运营复杂度,提高效率。 成本优化:通过统一搭建公共资源、集中采购和资源整合,提升资源利用率,降低总体成本。 全局视图:CCoE团队集中监控和分析整个企业的云资源使用情况,可以进一步优化资源配置。 集中化运营模式的缺点如下: 缺乏敏捷性: 所有云资源请求都需要经过CCoE团队,可能导致响应速度慢,影响业务的敏捷性。
而增加成本或影响性能。 优化建议:根据业务需求和应用特点,选择合适的云资源规格,可以采用自动扩展策略,合理设置包周期和按需资源的比例,定期监控资源使用情况,持续优化调整。 设计存在单点故障 架构设计时未考虑高可用性,导致关键组件成为单点故障,一旦发生故障,整个系统将无法正常工作。
需要消耗一定的计算、存储、网络、安全、数据库、中间件、大数据、AI服务等资源。大型业务系统能够包含多个子系统。 IT管理系统:为了支撑业务系统的长期安全稳定运行所建立的IT支撑和管理系统,如安全运营中心、IAM和监控运维系统等。 子系统:大型业务系统或IT管理系统通常包含多个相互