搜索_华为云

血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知 DataArts作业需要提前导出DataArts作业到华为云OBS桶，并将桶的读写权限委托给迁移中心。 SQL作业

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 血缘采集
自定义参数说明 - 迁移中心 MGC

自定义参数说明在创建数据湖探索 DLI校验任务时，支持的自定义参数及说明参见表1。表1 DLI校验任务支持的自定义参数说明参数名称默认值描述 mgc.mc2dli.table.partition.enable true DLI表分区为空或者分区不存在时需要通过查询DLI的元数据去判断分区存不存在。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
创建目的端组件连接 - 迁移中心 MGC

创建目的端组件连接对大数据组件数据进行一致性校验时，需要与大数据组件建立连接，用于数据查询。目前支持创建连接的大数据组件包括： Doris HBase ClickHouse Hive Metastore 操作步骤登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
创建目的端组件连接 - 迁移中心 MGC

创建目的端组件连接对大数据组件数据进行一致性校验时，需要与大数据组件建立连接，用于数据查询。目前支持创建连接的大数据组件包括： Doris HBase ClickHouse Hive Metastore 操作步骤登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择创建的大数据迁移项目。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建目的端连接
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知 DataArts作业需要提前导出DataArts作业到华为云OBS桶，并将桶的读写权限委托给迁移中心。 SQL作业

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
公网采集权限要求 - 迁移中心 MGC

公网采集权限要求通过公网采集各云平台资源所需的权限如下：阿里云资源采集采集阿里云各类资源所需的权限参见下表。资源类型云服务 Action 最小权限策略主机 ECS ecs:DescribeInstances Read ecs:DescribeDisks List ec

帮助中心 > 迁移中心 MGC > 产品介绍 > 采集安全性说明
创建统计任务并执行校验 - 迁移中心 MGC

创建统计任务并执行校验利用创建的源端连接和目的端连接，分别创建源端和目的端统计任务，获取源端和目的端的数据信息，以便于进行数据校验。支持的大数据组件和统计方式说明请参见大数据校验概述。注意事项创建的源端统计任务和目的端统计任务的统计方式必须保持一致。 HBase安全集群任

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
工具概述 - 迁移中心 MGC
工具概述 - 迁移中心 MGC

ps1 /Edge/tools/plugins/collectors/rda-collector-server/powershell 是检查VSS镜像服务 .\systemService.ps1 无功能类 tcpNum.ps1 /Edge/tools/plugins/collect

帮助中心 > 迁移中心 MGC > 工具指南
OBS多前缀批量迁移 - 迁移中心 MGC

登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择创建的应用迁移项目。单击左侧导航栏的“源端发现>资源采集”，进入资源采集页面。选择“在线调研”页签，单击“云平台采集”，进入云平台采集参数配置页面。图1 云平台采集根据表1，完成基础配置和任务配置区域的参数配置。表1 基础配置和任务配置区域参数配置说明

 帮助中心 > 迁移中心 MGC > 最佳实践 > 存储迁移相关最佳实践
创建元数据连接 - 迁移中心 MGC

创建元数据连接创建元数据来源类型的连接，获取源端大数据库表清单。目前支持的连接类型，参见表1。表1 支持的元数据连接类型类别连接类型大数据组件 Hive Metastore Doris HBase ClickHouse Delta Lake（有元数据） Delta Lake（无元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 采集元数据
全量数据迁移 - 迁移中心 MGC
全量数据迁移 - 迁移中心 MGC

全量数据迁移将源端数据库中的所有数据迁移到目的端华为云数据湖探索（DLI）。前提条件已完成所有准备工作。已创建源端连接。已创建目的端连接。开始迁移前，需要联系技术支持人员，将您添加到允许jar程序访问DLI元数据功能的白名单中。操作步骤登录迁移中心控制台。在左侧

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移 > 迁移实施
创建元数据连接 - 迁移中心 MGC

创建元数据连接创建元数据来源类型的连接，获取源端大数据库表清单。目前支持的连接类型，参见表1。表1 支持的元数据连接类型类别连接类型大数据组件 Hive Metastore Doris HBase ClickHouse Delta Lake（有元数据） Delta Lake（无元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 采集元数据
全量数据迁移 - 迁移中心 MGC
全量数据迁移 - 迁移中心 MGC

全量数据迁移将源端数据库中的所有数据迁移到目的端华为云数据湖探索（DLI）。当迁移的表数量较多或单个表的列数较多时，迁移过程可能会耗费较长时间。前提条件已完成所有准备工作。已创建源端连接。已创建目的端连接。开始迁移前，需要联系技术支持人员，将您添加到允许jar程序访问DLI元数据功能的白名单中。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI） > 创建迁移任务
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择创建的大数据迁移项目。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 血缘采集
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
增量数据迁移 - 迁移中心 MGC
增量数据迁移 - 迁移中心 MGC

增量数据迁移将上一次迁移后，在源端数据库中发生变化（新增、修改或删除）的数据同步至目的端华为云数据湖探索（DLI）。前提条件已完成所有准备工作。已创建源端连接。已创建目的端连接。已最少完成一次全量数据迁移。开始迁移前，需要联系技术支持人员，将您添加到允许jar程序访问DLI元数据功能的白名单中。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI） > 创建迁移任务
自定义参数说明 - 迁移中心 MGC

自定义参数说明在目的端配置中，支持配置的自定义参数及说明请参见表1和conf参数说明。表1 支持的自定义参数说明参数名称取值范围说明是否必填 spark.dli.metaAccess.enable - 填写true。是 spark.dli.job.agency.name

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移
自定义参数说明 - 迁移中心 MGC

自定义参数说明在目的端配置中，支持配置的自定义参数及说明请参见表1和conf参数说明。表1 支持的自定义参数说明参数名称取值范围说明是否必填 spark.dli.metaAccess.enable - 填写true。是 spark.dli.job.agency.name

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI）
增量数据迁移 - 迁移中心 MGC
增量数据迁移 - 迁移中心 MGC

增量数据迁移将上一次迁移后，在源端数据库中发生变化（新增、修改或删除）的数据同步至目的端华为云数据湖探索（DLI）。前提条件已完成所有准备工作。已创建源端连接。已创建目的端连接。已最少完成一次全量数据迁移。开始迁移前，需要联系技术支持人员，将您添加到允许jar程序访问DLI元数据功能的白名单中。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移 > 迁移实施
创建执行机连接 - 迁移中心 MGC

创建执行机连接执行机是获取数据的任务执行单元，需要分别与源端和目的端的执行机建立连接，然后执行数据统计，统计结果将用于数据校验。以下大数据组件需要通过创建执行机连接来进行数据校验： Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接

总条数： 93

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

血缘采集概述 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

创建目的端组件连接 - 迁移中心 MGC

创建目的端组件连接 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

公网采集权限要求 - 迁移中心 MGC

创建统计任务并执行校验 - 迁移中心 MGC

工具概述 - 迁移中心 MGC

OBS多前缀批量迁移 - 迁移中心 MGC

创建元数据连接 - 迁移中心 MGC

全量数据迁移 - 迁移中心 MGC

创建元数据连接 - 迁移中心 MGC

全量数据迁移 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

增量数据迁移 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

增量数据迁移 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线