搜索_华为云

创建源端组件连接 - 迁移中心 MGC

创建源端组件连接对大数据组件数据进行一致性校验时，需要与大数据组件建立连接，用于数据查询。目前支持创建源端连接的大数据组件包括： Doris HBase ClickHouse Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建源端连接
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择创建的大数据迁移项目。在左侧导航栏选择“调研>迁移准备”，进入迁移准备页面。选择元数据管理，在大数据血缘分析页签，单击“创建血缘采集任务”，弹出创建血缘采集任务窗口。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 迁移准备 > 血缘采集
自定义参数说明 - 迁移中心 MGC

自定义参数说明在目的端配置中，支持配置的自定义参数及说明请参见表1和conf参数说明。表1 支持的自定义参数说明参数名称取值范围说明是否必填 spark.dli.metaAccess.enable - 填写true。是 spark.dli.job.agency.name

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移
阿里云 ClickHouse迁移至CloudTable ClickHouse数据校验 - 迁移中心 MGC

信息获取，对应参数为“集群访问地址”。创建阿里云云数据库 ClickHouse统计任务并执行，方法请参考创建统计任务并执行校验。需要注意任务配置中的表组，选择步骤20.创建的表组。任务类型请选择大数据组件中的“阿里云云数据库 ClickHouse”。统计方式仅支持“全量校验”。

帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验
自定义参数说明 - 迁移中心 MGC

自定义参数说明在目的端配置中，支持配置的自定义参数及说明请参见表1和conf参数说明。表1 支持的自定义参数说明参数名称取值范围说明是否必填 spark.dli.metaAccess.enable - 填写true。是 spark.dli.job.agency.name

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI）
自定义参数说明 - 迁移中心 MGC

自定义参数说明在创建数据湖探索 DLI校验任务时，支持的自定义参数及说明参见表1。表1 DLI校验任务支持的自定义参数说明参数名称默认值描述 mgc.mc2dli.table.partition.enable true DLI表分区为空或者分区不存在时需要通过查询DLI的元数据去判断分区存不存在。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
自定义参数说明 - 迁移中心 MGC

自定义参数说明在创建数据湖探索 DLI校验任务时，支持的自定义参数及说明参见表1。表1 DLI校验任务支持的自定义参数说明参数名称默认值描述 mgc.mc2dli.table.partition.enable true DLI表分区为空或者分区不存在时需要通过查询DLI的元数据去判断分区存不存在。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
阿里云 ClickHouse迁移至MRS ClickHouse数据校验 - 迁移中心 MGC

集群ID的获取方法请参考获取MRS集群ID。创建阿里云云数据库 ClickHouse统计任务并执行，方法请参考创建统计任务并执行校验。需要注意任务配置中的表组，选择步骤20.创建的表组。任务类型请选择大数据组件中的“阿里云云数据库 ClickHouse”。统计方式仅支持“全量校验”。

帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验
DeltaLake（有元数据）迁移至MRS DeltaLake数据校验 - 迁移中心 MGC

DeltaLake（有元数据）迁移至MRS DeltaLake数据校验本文主要介绍将自建DeltaLake环境上的数据迁移至华为云MRS DeltaLake之后，使用迁移中心 MgC进行数据一致性校验的步骤和方法。 DeltaLake存在元数据，可通过数据湖元数据同步方式进行数据采集。

帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验
DeltaLake（无元数据）迁移至MRS DeltaLake数据校验 - 迁移中心 MGC

DeltaLake（无元数据）迁移至MRS DeltaLake数据校验本文主要介绍将自建DeltaLake环境上的数据迁移至华为云MRS DeltaLake之后，使用迁移中心 MgC进行数据一致性校验的步骤和方法。 DeltaLake不存在元数据，无法通过数据湖元数据同步方式进

 帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验
采集项列表 - 迁移中心 MGC
采集项列表 - 迁移中心 MGC

采集项列表本节为您列出各类型采集方式所包含的采集项以及用途。网段扫描主机（含深度采集）数据库（含深度采集）容器（含深度采集）平台（含深度采集）存储采集项说明作用 ip 主机IP 用于深度采集 port 主机端口用于深度采集 osType 系统类型用于深度采集

 帮助中心 > 迁移中心 MGC > 产品介绍 > 采集安全性说明
大数据校验概述 - 迁移中心 MGC

抽样分区校验 Doris 全量校验日级增量校验小时级增量校验 Hbase 全量校验指定时间校验 ClickHouse 全量校验阿里云云数据库ClickHouse 全量校验 CloudTable(HBase) 全量校验指定时间校验 CloudTable(ClickHouse)

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

准备工作为了确保迁移过程的顺利进行，需要完成以下必要的准备工作。华为账号准备使用MgC之前，您需要拥有一个华为账号或一个可用于访问MgC的IAM用户，并获取账号/IAM用户的访问密钥（AK/SK）。获取方法请参考准备工作。阿里云访问密钥（AK/SK）准备准备一组源端阿里云账号的Access

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移
创建目的端组件连接 - 迁移中心 MGC

创建目的端组件连接对大数据组件数据进行一致性校验时，需要与大数据组件建立连接，用于数据查询。目前支持创建连接的大数据组件包括： Doris HBase ClickHouse Hive Metastore 操作步骤登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
MRS Hive/CDH/EMR迁移至MRS Hive数据校验 - 迁移中心 MGC

MRS Hive/CDH/EMR迁移至MRS Hive数据校验本文主要介绍MRS Hive版本间数据迁移以及将自建CDH/EMR环境上的数据迁移至华为云MRS Hive之后，使用迁移中心 MgC进行数据一致性校验的步骤和方法。准备工作需要先在源端内网环境中安装用于配合数据校验的工具MgC

帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验
配置rollback_hosts_linux.sh脚本 - 迁移中心 MGC

配置rollback_hosts_linux.sh脚本根据提供的脚本示例，结合实际情况，修改示例中的相关配置。前提条件已完成准备工作。操作步骤在执行脚本的主机上创建一个名为“rollback_hosts_linux.sh”的文件，然后将以下脚本示例的内容复制到文件中。如

 帮助中心 > 迁移中心 MGC > 最佳实践 > 主机迁移相关最佳实践 > 批量修改与还原源端Linux主机的Host配置 > 配置脚本
准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

准备工作为了确保迁移过程的顺利进行，需要完成以下必要的准备工作。华为账号准备使用MgC之前，您需要拥有一个华为账号或一个可用于访问MgC的IAM用户，并获取账号/IAM用户的访问密钥（AK/SK）。获取方法请参考准备工作。在创建元数据连接时，如果要使用“采集资源使用信息”

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI）
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知 DataArts作业需要提前导出DataArts作业到华为云OBS桶，并将桶的读写权限委托给迁移中心。 SQL作业

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 迁移准备 > 血缘采集
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知 DataArts作业需要提前导出DataArts作业到华为云OBS桶，并将桶的读写权限委托给迁移中心。 SQL作业

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集

总条数： 111

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建源端组件连接 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

阿里云 ClickHouse迁移至CloudTable ClickHouse数据校验 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

阿里云 ClickHouse迁移至MRS ClickHouse数据校验 - 迁移中心 MGC

DeltaLake（有元数据）迁移至MRS DeltaLake数据校验 - 迁移中心 MGC

DeltaLake（无元数据）迁移至MRS DeltaLake数据校验 - 迁移中心 MGC

采集项列表 - 迁移中心 MGC

大数据校验概述 - 迁移中心 MGC

准备工作 - 迁移中心 MGC

创建目的端组件连接 - 迁移中心 MGC

MRS Hive/CDH/EMR迁移至MRS Hive数据校验 - 迁移中心 MGC

配置rollback_hosts_linux.sh脚本 - 迁移中心 MGC

准备工作 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线