搜索_华为云

血缘采集 - 迁移中心 MGC
血缘采集 - 迁移中心 MGC

血缘采集血缘采集概述导出作业创建血缘采集任务查看血缘关系父主题：大数据血缘

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘
血缘采集 - 迁移中心 MGC
血缘采集 - 迁移中心 MGC

血缘采集血缘采集概述导出作业创建血缘采集任务查看血缘关系父主题：大数据血缘

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘
创建表组并添加数据表 - 迁移中心 MGC

单列表中可以查看导入的数据表。导出数据表支持将Delta Lake和Hudi有元数据的数据表导出为CSV格式。无元数据的数据表不支持导出。在表管理页面，选择库表清单页签。单击列表上方的“导出 > 导出数据表”按钮，弹出导出窗口。选择需要导出的数据表所在表组，单击“确认”。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
创建迁移任务 - 迁移中心 MGC
创建迁移任务 - 迁移中心 MGC

创建迁移任务元数据全量迁移元数据增量感知全量数据迁移增量数据迁移父主题：大数据数据迁移（MaxCompute迁移到DLI）

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI）
Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” - 迁移中心 MGC

Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” 问题描述对Hive进行大数据校验，校验任务执行成功，查看校验结果，发现部分字段的“源端数据”和“目的端数据”显示为“0”或“-1”。问题分析出现该问题可能是因为数值超出了Hive支持的数值范围。在数据处理中，如果遇到

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验
Delta 数据量较大时，如何优化校验任务？ - 迁移中心 MGC

为避免数据重复，除了步骤1.创建的第一个元数据连接以外，新增的元数据连接不需要创建同步任务进行元数据采集。参考创建表组并添加数据表，将源端数据表加入表组中。其中元数据连接选择步骤1.创建的第一个元数据连接。分别创建源端执行机连接和目的端执行机连接，方法请参考创建执行机连接。

帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验
创建源端组件连接 - 迁移中心 MGC

MySQL节点IP：输入MySQL数据库服务器的IP地址。 MySQL服务端口：输入MySQL数据库服务的端口号。数据库名：输入存储Hive表元数据的数据库名称。说明：请确保填写的MySQL凭证、节点IP、服务端口和数据库名与Hive实际使用的MySQL数据库相匹配，否则会导致数据校验失败。表5

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建源端连接
创建源端组件连接 - 迁移中心 MGC

MySQL节点IP：输入MySQL数据库服务器的IP地址。 MySQL服务端口：输入MySQL数据库服务的端口号。数据库名：输入存储Hive表元数据的数据库名称。说明：请确保填写的MySQL凭证、节点IP、服务端口和数据库名与Hive实际使用的MySQL数据库相匹配，否则会导致数据校验失败。表5

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建源端连接
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

创建源端连接创建源端云服务连接创建源端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
使用须知 - 迁移中心 MGC
使用须知 - 迁移中心 MGC

列连接，元数据迁移需要使用DLI SQL队列连接，数据迁移需要使用DLI 通用队列连接。配置错误的队列连接类型会导致迁移任务失败，因此在配置任务时，必须仔细检查并确保任务类型与队列类型相匹配。元数据迁移与库的数量在进行元数据迁移时，MgC会根据识别到的源端数据库的数量，在DL

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI）
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

创建源端连接创建源端云服务连接创建源端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

Agent（原Edge）访问和读取源端阿里云 MaxCompute中存储的数据。前提条件已完成准备工作。操作步骤登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择在完成准备工作时创建的大数据迁移项目。在左侧导航栏选择“实施>大数据数据迁移”，进入大数据数据迁移页面。单击页面右上角的“连接管理”按钮，进入连接管理页面。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI）
创建目的端连接 - 迁移中心 MGC

创建目的端连接创建执行机连接创建目的端云服务连接创建目的端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

开通DLI服务Spark 3.3和jar程序访问元数据白名单数据迁移需要使用DLI服务的Spark 3.3特性和jar程序访问DLI元数据特性，请联系DLI服务的技术支持人员申请开通。（可选）开通DLI服务Spark生命周期白名单如果待迁移的元数据有生命周期表（即DDL带有LIFECY

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI）
查看并导出执行结果 - 迁移中心 MGC

务执行结果进行过滤，如有过滤，则只导出过滤后的数据。图1 导出执行结果单击“导出管理”按钮，右侧弹出导出管理窗口。当导出进度为导出成功后，单击操作列的“下载”，可以将导出结果下载到本地。图2 下载导出结果父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移
创建执行机连接 - 迁移中心 MGC

创建执行机连接执行机是获取数据的任务执行单元，需要分别与源端和目的端的执行机建立连接，然后执行数据统计，统计结果将用于数据校验。以下大数据组件需要通过创建执行机连接来进行数据校验： Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
创建执行机连接 - 迁移中心 MGC

创建执行机连接执行机是获取数据的任务执行单元，需要分别与源端和目的端的执行机建立连接，然后执行数据统计，统计结果将用于数据校验。以下大数据组件需要通过创建执行机连接来进行数据校验： Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建目的端连接
创建目的端连接 - 迁移中心 MGC

在左侧导航栏选择“实施>大数据数据迁移”，进入大数据数据迁移页面。在页面左上角的当前项目下拉列表中选择在完成准备工作时所创建的迁移项目。单击页面右上角的“连接管理”按钮，进入连接管理页面。单击页面右上角的“创建目的端连接”按钮，右侧弹出新增连接窗口。连接类型选择“数据湖探索（DLI

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移
创建目的端连接 - 迁移中心 MGC

创建目的端连接创建执行机连接创建目的端云服务连接创建目的端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
自定义参数说明 - 迁移中心 MGC

Spark应用的Driver内存，参数配置例如：2G, 2048M。该配置项会替换“sc_type”中对应的默认参数，使用时必须带单位，否则会启动失败。父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移

总条数： 334

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

血缘采集 - 迁移中心 MGC

血缘采集 - 迁移中心 MGC

创建表组并添加数据表 - 迁移中心 MGC

创建迁移任务 - 迁移中心 MGC

Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” - 迁移中心 MGC

Delta 数据量较大时，如何优化校验任务？ - 迁移中心 MGC

创建源端组件连接 - 迁移中心 MGC

创建源端组件连接 - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

使用须知 - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

创建目的端连接 - 迁移中心 MGC

准备工作 - 迁移中心 MGC

查看并导出执行结果 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

创建目的端连接 - 迁移中心 MGC

创建目的端连接 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线