检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
监控应用日志,分析并解决潜在问题。 熟悉云平台的APM服务,具备应用性能监控和日志分析能力。 掌握CI/CD工具和容器编排工具。熟悉常见的应用部署方式(如容器化、微服务架构)。 熟悉常见中间件(如Nginx、Redis、Kafka)的运维管理。 业务部门 父主题: 云卓越中心
跟踪支出异常 资源包管理 监控资源包是否即将用尽 账单管理 了解各帐期的实际消费与支出,多维对账 成本监控 监控云支出的异常增长,减少异常账单 成本分配与可视化 成本分析(含分析报告) 了解成本趋势与分布,洞察成本变化的驱动因素 成本单元 将成本按照业务语义分配到有意义的分组,拆分公共成本
运维治理阶段需要针对云上IT基础设施、应用系统和大数据平台进行精益化治理、确定性运维、全方位安全运营和精细化FinOps,并基于WAF框架进行持续优化。
华为云将其基础设施的安全与隐私保护视为运维运营安全的重中之重。基础设施主要包括支撑云服务的物理环境,华为自研的软硬件,以及运维运营包括计算、存储、网络、数据库、平台、应用、身份管理和高级安全服务等各项云服务的系统设施。
模式2的公共服务和管理账号合并了模式1中运维监控账号、公共服务账号、数据平台账号和DevOps账号的职能。
任务调度: 大数据平台通常需要处理复杂的数据作业。任务调度系统(如Azkaban等)用于管理和调度各种数据处理作业,可以设置作业的依赖关系、调度频率、重试策略等,以确保作业的顺利执行和任务的准时完成。 数据应用: 大数据平台的最终目的是为业务提供有价值的数据应用。
IT部门 云培训师 开发和交付云计算相关的培训课程,涵盖云基础设施、云架构设计、云运维、云安全等方面。 推广用云和管云的最佳实践,通过最佳实践减少云化风险。 扎实的云技术知识和实践经验。 优秀的教学能力和沟通技巧,能够将复杂的云技术概念清晰地传达给他人。
在作业验证过程中,可以使用监控工具、日志分析和数据校验等手段,确保迁移后的大数据任务的可靠性和稳定性。 父主题: 大数据迁移
识别空闲和低利用资源 华为云提供资源优化建议,通过监控客户的历史消费情况和资源利用率,帮助您识别空闲资源(比如云主机)。您可参考系统给出的利用率信息、预估月度节省,结合业务团队意见,采取资源优化行动。
图1 安全运营框架 划分安全运营职责 首先,根据企业设计的云运营模式,明确业务部门的应用团队与CCoE团队之间的责任边界,如企业采用了赋能与协同运营模式,CCoE团队负责平台层面的安全防护和集中安全运营,应用团队则需要负责应用系统及所需云资源的安全运营。
(AOM,CES,APM等)的管理权限 PaaS管理组 也叫中间件管理员,统一管理各个账号下的中间件资源 所有账号下中间件资源的管理权限 所有其他账号下的运维监控服务(AOM,CES,APM等)的管理权限 自动化运维组 统一监控和运维各个账号下的资源 运维监控账号的Tenant Administrator
大数据迁移批次规划说明 大数据迁移上云时,是选择整体迁移还是分批迁移,原则如下: 整体迁移的场景: 规模小:大数据平台数据量少(TB级),计算任务数量不多,可以采用整体迁移的方法,先在云上部署大数据平台,然后全量迁移元数据、数据和任务。
与云运维团队和应用团队合作,优化应用系统的成本效益。 实施成本优化策略,例如改变计费模式、购买资源包、关闭闲置资源等。 熟悉云平台的成本管理工具。 熟悉各种云服务的计费模式。 具备数据分析能力,能够从大量数据中提取有价值的见解。
在这种模式下,虽然业务单元在各自的云账号中独立运行,但IT部门可以通过统一的策略和工具,对全公司的云资源进行监控、监管和优化。
降低运维成本: 云服务商负责IT 基础设施的维护和管理,企业无需投入大量人力和资金进行IT基础设施的日常运维。而且云平台提供了智能监控系统和自动化运维系统可以大幅提升应用系统的运维效率,企业可以减少在应用系统运维领域的人力投入,进一步降低了运维人力成本。
CTO、云架构师 技术 运维视角 基于云平台和云服务的特点构建完善的云上IT运维体系,针对IT基础设施和应用系统进行监控、告警、故障定位和故障修复,保障IT基础设施和应用系统的长期稳定运行。
云化转型顶层规划:指导云架构团队、云运维团队、云安全团队和云治理团队等成员进行云化转型的顶层规划,包括应用云化流程优化、Landing Zone设计、平台工程设计、云运营模式设计等,对顶层设计的效果承担最终责任。
与开发团队和运维团队沟通 与应用程序的开发团队和运维团队进行沟通,了解他们对系统依赖关系的认识和理解。他们可能提供有关应用程序的详细信息、依赖关系的描述以及与其他系统的集成情况。 代码分析 仔细检查应用程序的源代码,特别是配置文件和代码中涉及的外部依赖关系。
重点岗位管理 为了内部有序管理,消减人员管理风险对业务连续性和安全性带来的潜在影响,建议您对运维工程师等重点岗位实施专项管理。具体如下: 上岗安全审查:针对新上岗人员,开展上岗人员安全审查,确保上岗人员背景和资历符合企业的信息安全要求。
如果目标云平台上没有对应的大数据集群组件,部署架构设计时,可以考虑继续采用自建的方案。如果目标云平台上有对应的大数据集群组件,但兼容性较差,经评估可能需要较大的改造工作量,部署架构设计时,可以考虑继续采用自建的方案。 最小改造原则:如无特别的业务驱动,要尽量避免进行大规模改造。