搜索_华为云

大数据血缘 - 迁移中心 MGC
大数据血缘 - 迁移中心 MGC

大数据血缘部署迁移工具Edge 采集元数据血缘采集父主题：旧版

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版
大数据校验 - 迁移中心 MGC
大数据校验 - 迁移中心 MGC

大数据校验新增大数据校验数据连接时，凭证列表数据缺失 Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” Hive校验的sum统计结果显示未达标 DLI校验任务出现大量失败表 Delta 数据量较大时，如何优化校验任务？

帮助中心 > 迁移中心 MGC > 常见问题
大数据血缘 - 迁移中心 MGC
大数据血缘 - 迁移中心 MGC

大数据血缘部署MgC Agent（原Edge）采集元数据血缘采集父主题：新版

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版
创建元数据连接 - 迁移中心 MGC

创建元数据连接创建元数据来源类型的连接，获取源端大数据库表清单。目前支持的连接类型，参见表1。表1 支持的元数据连接类型类别连接类型大数据组件 Hive Metastore Doris HBase ClickHouse Delta Lake（有元数据） Delta Lake（无元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 采集元数据
创建元数据连接 - 迁移中心 MGC

创建元数据连接创建元数据来源类型的连接，获取源端大数据库表清单。目前支持的连接类型，参见表1。表1 支持的元数据连接类型类别连接类型大数据组件 Hive Metastore Doris HBase ClickHouse Delta Lake（有元数据） Delta Lake（无元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 采集元数据
迁移后主机私有IP保持不变 - 迁移中心 MGC

变，减少因IP变动而需要对业务代码进行的修改工作。免责声明业务可用性风险本功能旨在帮助用户在迁移后保持主机的私有IP地址与源端一致，但不保证切换IP后的业务可用性。需要用户自行评估并承担由此带来的风险。回退说明主机迁移工作流提供自动化的IP不变功能，但不提供自动化回退功

 帮助中心 > 迁移中心 MGC > 最佳实践 > 主机迁移相关最佳实践
创建并运行元数据同步任务 - 迁移中心 MGC

也可以自定义名称。元数据连接根据实际需求，选择已创建的元数据连接类型。数据库填写需要进行元数据同步的数据库名称。须知：元数据连接为MaxCompute类型时，该参数为必填参数，不能为空。其他元数据连接类型，该参数为可选参数，不填则代表同步全部数据库。并发线程数设置

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 采集元数据
创建并运行元数据同步任务 - 迁移中心 MGC

在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在元数据采集区域，单击“创建任务 > 元数据同步”按钮，右侧弹出创建任务-元数据同步窗口。根据表1，配置元数据同步任务参数。表1 元数据同步任务参数配置说明参数配置说明任务名称默认创建名称为“元数据同步任务-4位随机数（字母和数字）”，也可以自定义名称。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 采集元数据
通过HTTP迁移MinIO存储数据到华为云OBS - 迁移中心 MGC

源端信息参数说明参数说明数据站点类型选择“HTTP/HTTPS数据源”。列表路径填写在步骤二存放URL列表文件的文件夹名称（在本文示例中为minioUrl/），注意要在文件夹名称后面加上“/”。表3 目的端信息参数说明参数说明数据站点类型选择“华为云OBS”

帮助中心 > 迁移中心 MGC > 最佳实践 > 存储迁移相关最佳实践
准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

开通DLI服务Spark 3.3和jar程序访问元数据白名单数据迁移需要使用DLI服务的Spark 3.3特性和jar程序访问DLI元数据特性，请联系DLI服务的技术支持人员申请开通。（可选）开通DLI服务Spark生命周期白名单如果待迁移的元数据有生命周期表（即DDL带有LIFECY

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移
如何防止采集数据泄露？ - 迁移中心 MGC

如何防止采集数据泄露？ MgC通过以下方式确保采集数据的安全：数据加密传输：采用加密技术来保护数据在传输过程中的安全本地加密存储凭证：MgC Agent上的凭证信息都会经过加密处理后保存在本地，不会通过网络传输到云端。本地数据采集与存储：通过MgC Agent线下采集的信息

 帮助中心 > 迁移中心 MGC > 常见问题 > 产品咨询
通过HTTP迁移Ceph存储数据到华为云OBS - 迁移中心 MGC

源端信息参数说明参数说明数据站点类型选择“HTTP/HTTPS数据源”。列表路径填写在步骤二存放URL列表文件的文件夹名称（在本文示例中为cephUrl/），注意要在文件夹名称后面加上“/”。表3 目的端信息参数说明参数说明数据站点类型选择“华为云OBS”.

帮助中心 > 迁移中心 MGC > 最佳实践 > 存储迁移相关最佳实践
Hive校验的sum统计结果显示未达标 - 迁移中心 MGC

客户端，进行sql操作，出现用同一个命令存在返回值不同的情况。这是因为在进行大数据对数的求和计算时，由于分布式计算顺序的不确定性，可能会导致计算结果的不一致性。特别是处理接近或等于double类型最大值（1.7976931348623157E+308）的数据时，加上一个较小的数值（如2.0）可能会导致数值溢

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验
Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” - 迁移中心 MGC

Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” 问题描述对Hive进行大数据校验，校验任务执行成功，查看校验结果，发现部分字段的“源端数据”和“目的端数据”显示为“0”或“-1”。问题分析出现该问题可能是因为数值超出了Hive支持的数值范围。在数据处理中，如果遇到

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验
准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

开通DLI服务Spark 3.3和jar程序访问元数据白名单数据迁移需要使用DLI服务的Spark 3.3特性和jar程序访问DLI元数据特性，请联系DLI服务的技术支持人员申请开通。（可选）开通DLI服务Spark生命周期白名单如果待迁移的元数据有生命周期表（即DDL带有LIFECY

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI）
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

创建源端连接是为了允许迁移工具Edge访问和读取源端阿里云 MaxCompute中存储的数据。前提条件已完成准备工作。操作步骤登录迁移中心控制台。在左侧导航栏选择“实施>大数据数据迁移”，进入大数据数据迁移页面。在页面左上角的当前项目下拉列表中选择在完成准备工作时所创建的迁移项目。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移
存储工作流执行失败，列表提示“COMPARISON_ATTRIBUTE_NOT_SAME”，如何处理？ - 迁移中心 MGC

NOT_SAME”。解决方法根本原因是元数据校验失败。具体分为两种场景：场景一：由于元数据中的mtime属性引起的校验失败。在对象存储数据迁移过程中，如果启用了元数据保留迁移，且目的端存储为PFS桶，可能会因为源端对象的元数据中包含mtime属性而导致校验失败。这是因为对

 帮助中心 > 迁移中心 MGC > 常见问题 > 存储迁移
关于OBS、NAS和SMB存储系统之间进行异构迁移的对象长度限制说明 - 迁移中心 MGC

了解并遵守每个系统的对象长度限制是成功执行异构迁移的关键。根据具体的迁移方向，确保对象的路径长度符合目的端系统的要求，以避免迁移失败或数据不一致的问题。不同存储系统对路径和文件夹长度的限制参见下表：存储系统路径和文件夹长度限制 OBS 文件夹和文件路径的最大长度限制均为1023个字节。

帮助中心 > 迁移中心 MGC > 常见问题 > 存储迁移
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

Agent（原Edge）访问和读取源端阿里云 MaxCompute中存储的数据。前提条件已完成准备工作。操作步骤登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择在完成准备工作时创建的大数据迁移项目。在左侧导航栏选择“实施>大数据数据迁移”，进入大数据数据迁移页面。单击页面右上角的“连接管理”按钮，进入连接管理页面。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI）
创建目的端连接 - 迁移中心 MGC

在左侧导航栏选择“实施>大数据数据迁移”，进入大数据数据迁移页面。在页面左上角的当前项目下拉列表中选择在完成准备工作时所创建的迁移项目。单击页面右上角的“连接管理”按钮，进入连接管理页面。单击页面右上角的“创建目的端连接”按钮，右侧弹出新增连接窗口。连接类型选择“数据湖探索（DLI

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移

总条数： 250

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

大数据血缘 - 迁移中心 MGC

大数据校验 - 迁移中心 MGC

大数据血缘 - 迁移中心 MGC

创建元数据连接 - 迁移中心 MGC

创建元数据连接 - 迁移中心 MGC

迁移后主机私有IP保持不变 - 迁移中心 MGC

创建并运行元数据同步任务 - 迁移中心 MGC

创建并运行元数据同步任务 - 迁移中心 MGC

通过HTTP迁移MinIO存储数据到华为云OBS - 迁移中心 MGC

准备工作 - 迁移中心 MGC

如何防止采集数据泄露？ - 迁移中心 MGC

通过HTTP迁移Ceph存储数据到华为云OBS - 迁移中心 MGC

Hive校验的sum统计结果显示未达标 - 迁移中心 MGC

Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” - 迁移中心 MGC

准备工作 - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

存储工作流执行失败，列表提示“COMPARISON_ATTRIBUTE_NOT_SAME”，如何处理？ - 迁移中心 MGC

关于OBS、NAS和SMB存储系统之间进行异构迁移的对象长度限制说明 - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

创建目的端连接 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线