检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Studio支持对接所有华为云的数据湖与数据库云服务作为数据湖底座,例如MRS Hive、数据仓库服务DWS等,也支持对接企业传统数据仓库,例如Oracle、MySQL等。详细信息请参考官网文档。 数据接入服务(Data Ingestion Service,简称DIS) 处理或分析流数据的自定义应用程序
(海量数据迁移推荐) 全量+增量 操作简单,支持增量迁移。对海量数据支持更好 适用于将源端对象存储、网络文件存储,大数据存储迁移至华为云OBS对象存储、华为云SFS弹性文件存储、华为云大数据存储中的海量数据迁移。 开源工具rclone/rsync 全量 rclone配置复杂;rsync迁移效率低
目标数据库 最佳实践在线文档 其他云MySQL数据库 华为云RDS for MySQL 其他云MySQL迁移到云数据库 RDS for MySQL 华为云GaussDB(for MySQL) 其他云MySQL迁移到GaussDB(for MySQL) 其他云MongoDB 华为云DDS
AZ整体宕机情况,确保集群始终有一份完整的副本确保数据高可用。 图6 中间件层Sorl高可用设计示例 数据层- MySQL高可用 主备实例跨AZ部署,借助原生MySQL主从复制同步能力实现主备间数据同步。 主备实例以VIP对外提供服务,自身IP不对租户开放。 主备秒级切换,主备切
2000K 5ms OBS TB级 千万级 10ms+ 成本优化 存储类型的选择还需考虑成本因素,在满足业务性能要求的情况下降低存储成本。 满足业务性能要求的情况下,优先选择存储单价低的存储服务。 按规格计费的存储(EVS及SFS Turbo)做好业务增量预测和容量监控告警,建议
以确保数据的一致性和准确性。 数据存储: 大数据平台需要具备高效的数据存储能力,以承载海量的数据。常见的数据存储技术包括分布式文件系统(如HDFS)、列式数据库(如HBase)等。这些存储系统提供高可靠性、可扩展性和容错性,以支持大规模数据的存储和访问需求。 大数据计算: 大数据
集群部署,单AZ的故障不影响业务运行; RDS for MySQL采用主备部署方式,主备实例之间的数据实时同步,如果主实例出现故障,备实例可以快速升为主实例; Redis、Kafka、CSS云搜索、RDS for MySQL都支持把数据备份到OBS桶,应对数据误操作之后的风险;
数据库检查项 数据库相关 检查华为云数据库端口是否和生产保持一致 是 否 数据库相关 检查NTP时钟设置是否一致 是 否 数据库相关 检查中间件Reids数据迁移任务状态正常,无异常报错或告警(包含回退任务) 是 否 数据库相关 检查DRS-mysql数据迁移任务状态‘增量迁移中’,
数据调研主要包括如下方面: 表1 数据调研方法表 调研内容 调研目的 举例 数据类型 根据数据类型选择合适的迁移工具 HDFS、HBase、MySQL等 数据量 历史数据量,用于评估历史数据迁移周期; 日增量数据,用于评估每日增量数据同步周期。 历史数据X PB 日增量Y TB 数据分层
批次规划 一、迁移分组 迁移分组主要是基于依赖关系将迁移对象进行分组,我们将一组具有强依赖关系的应用程序和基础架构的集合(包括APP、主机、存储、数据库、中间件等)放进一个迁移分组,迁移的时候要放同一批次,切换的时候要一起切。 依赖关系主要包括三种:共享数据依赖、共享服务器依赖、应用间的通信依赖。
导出源端HIVE元数据,导入华为云MRS-Hive 外置元数据MySQL 使用华为云DRS服务同步MySQL中的元数据到云上RDS 存量数据 Hive历史数据存放在HDFS 使用华为云CDM工具迁移所有历史数据到华为云MRS服务或华为云OBS存储(存算分离场景) Hbase历史数据 使用华为云
查看实例类型。 表1 ECS实例类型 架构 实例类型 CPU 实例系列 系列说明 适用场景 x86 通用计算增强型 Intel c 计算、存储、网络各方面性能均衡,CPU独享、性能稳定 适合大部分应用场景 AMD ac 与c系列相比,CPU不同、同规格分配的网络带宽更小,保持稳定性能的同时成本更低
将IDC机房或其他公有云的HBase集群中的数据迁移到华为云MRS服务。HBase会把数据存储在HDFS上,主要包括HFile文件和WAL文件,由配置项“hbase.rootdir”指定在HDFS上的路径,华为云MRS的默认存储位置是“/hbase”文件夹下。HBase自带的一些机制和工具命令也可以
应用类型 接入层 应用层 中间件层 数据层 接入域名 备注 应用名称 NAT NGINX 主机数量 IP地址 Redis Kafka MQ MySQL Mongo 内部/外部域名 WAF 备注 也可参考下图绘制应用的部署架构图: 调研方式如下图所示: 图1 调研方式 调研技术组件的详细信息
Redis服务一般分为两种大的场景:缓存和数据库存储。在缓存时,一般不用进行迁移数据,大多数场景都是重新在华为云SQL数据库中重新缓存。一般迁移数据都是针对的Redis作为数据库存储使用的场景,其中在web场景下的缓存session时,也可以不用迁移,当客户端重新登录时会在华为云DCS中再一次存储。 离线备份导入
Zone、平台工程、网络、安全、存储、灾备等方面的知识和经验。 熟悉TOGAF和WAF等架构框架。 具备良好的沟通能力、团队合作精神和领导力。 企业架构师团队或者外聘 数据架构师 负责设计和管理企业在云上的数据架构,包括数据存储、数据处理、数据集成和数据治理。 选择合适的数据存储方案,例如关系型数据库、NoSQL数据库、数据仓库等。
云基础设施管理员 负责云平台上存储、虚拟机、操作系统等基础设施的日常运维管理。 监控和优化云资源的使用效率,确保资源分配合理。 处理虚拟机、存储和操作系统相关的故障,保障系统的高可用性。 定期进行系统补丁更新和安全加固。 熟悉主流云平台的虚拟机和云存储服务。 掌握Linux和Windows操作系统的管理与优化。
深的积淀,既有端到端的安全技术体系,也有完备的安全管理流程和规范,更有一支庞大的安全专家团队每时每刻在保障云平台的安全,因此公有云相比大多数组织的内部IT团队有更强大的信息安全保障能力。 市场扩张 将业务扩张到全球市场是企业收入增长的重要途径。借助云服务商的全球布局,可以有效支撑
制,扩展性和弹性等。 调研大数据集群数量和功能划分:例如Hadoop集群、Spark集群、Hive集群等,并根据业务需求划分它们的功能,如存储集群、计算集群、查询集群等。 调研各个集群或组件负责的业务范围,以及它们处理的数据类型和数据流转的方式。 调研用于处理实时数据和离线数据的组件,例如实时数据可能使用Apache
费。 存储资源成本 对象存储、块存储、文件存储等服务的费用,通常按存储空间、请求次数、数据传输量等计费。 网络资源成本 互联网带宽、公网IP地址、NAT网关、负载均衡器、VPN等网络服务的费用。 数据库成本 关系型数据库、NoSQL数据库等服务的费用,通常按实例规格、存储空间、请求次数等计费。