检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
DeltaLake(有元数据)迁移至MRS DeltaLake数据校验 本文主要介绍将自建DeltaLake环境上的数据迁移至华为云MRS DeltaLake之后,使用迁移中心 MgC进行数据一致性校验的步骤和方法。 DeltaLake存在元数据,可通过数据湖元数据同步方式进行数据采集。
Server IP 填写连接到阿里云EMR ClickHouse服务器的IP地址。通常是运行ClickHouse的主机IP地址。 HTTP端口 非安全集群下,与阿里云EMR ClickHouse 服务器通信的 HTTP 端口。 可以在EMR控制台ClickHouse服务的配置页面,单击
ClickHouse Server IP 填写连接到源端ClickHouse服务器的IP地址。通常是运行ClickHouse的主机IP地址。 HTTP端口 非安全集群下,与源端ClickHouse 服务器通信的 HTTP 端口。 可以登录源端集群的FusionInsight Manager,选择“集群
DeltaLake(无元数据)迁移至MRS DeltaLake数据校验 本文主要介绍将自建DeltaLake环境上的数据迁移至华为云MRS DeltaLake之后,使用迁移中心 MgC进行数据一致性校验的步骤和方法。 DeltaLake不存在元数据,无法通过数据湖元数据同步方式进
区域,谷歌云、亚马逊云为中国香港区域,微软云为东亚区域,七牛云、优刻得为中国大陆,按量优惠取最贵收费,若存在冗余存储而官方存储类型未区分取非冗余储存价格,单位:元。 下表中不存在的云厂商存储类型可能会迁移失败,建议手动解冻后再迁移至OBS。 表1 各云厂商的存储类型和华为云的存储类型转换关系
MaxCompute迁移至MRS Hive数据校验 本文主要介绍将阿里云 MaxCompute数据迁移至华为云MRS Hive后,使用迁移中心 MgC进行数据一致性校验的步骤和方法。 准备工作 需要先在源端内网环境中安装用于配合数据校验的工具Edge并注册用户,方法请参见安装Linux版本的Edge工具。
的AccessKey信息。 大数据-Doris 用户名/密码 输入登录Doris数据库的用户名、密码。 大数据-HBase 用户名/密钥 非安全集群需要上传core-site.xml,hdfs-site.xml,yarn-site.xml,mapred-site.xml和hbase-site
创建并运行数据湖元数据同步任务 利用创建的Delta Lake元数据连接,将源端数据库的库、表、字段信息同步至迁移中心。仅Delta Lake(有元数据)支持创建数据湖元数据同步任务。 Delta Lake(无元数据)只能通过手动添加、导入模板等方式添加元数据库表信息,方法请参见查看元数据。
”,也可以自定义名称。 迁移工具 选择步骤3.与MgC建立连接的Edge工具。 启用安全连接 选择是否启用安全连接。 MetaStore在非安全集群下,可以不启用安全连接。 MetaStore在安全集群下,需要启用安全连接并选择凭证。凭证选择步骤4.在Edge侧所添加的源端Hive
”,认证方式选择“用户名/密钥”。凭证的添加方法请参考添加资源凭证。其中用户名输入HBase客户端登录用户名,密钥需要上传以下配置文件: 非安全集群(未开启Kerberos认证)需要上传core-site.xml,hdfs-site.xml,yarn-site.xml,mapred-site
MaxCompute迁移至DLI数据校验 本文主要介绍将阿里云 MaxCompute数据迁移至华为云数据湖探索 DLI后,使用迁移中心 MgC进行数据一致性校验的步骤和方法。 准备工作 需要先在源端内网环境中安装用于配合数据校验的工具Edge并注册用户,方法请参见安装Linux版本的Edge工具。