搜索_华为云

血缘采集 - 迁移中心 MGC
血缘采集 - 迁移中心 MGC

血缘采集血缘采集概述创建血缘采集任务查看血缘关系父主题：大数据血缘

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘
如何防止采集数据泄露？ - 迁移中心 MGC

如何防止采集数据泄露？ MgC通过以下方式确保采集数据的安全：数据加密传输：采用加密技术来保护数据在传输过程中的安全本地加密存储凭证：Edge上的凭证信息都会经过加密处理后保存在本地，不会通过网络传输到云端。本地数据采集与存储：通过Edge线下采集的信息会被安全地保存在本地

 帮助中心 > 迁移中心 MGC > 常见问题 > 产品咨询
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

创建源端连接创建源端云服务连接创建源端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
数据采集架构 - 迁移中心 MGC
数据采集架构 - 迁移中心 MGC

MgC利用部署在源端网络中的Edge设备完成数据采集。数据采集架构图，如图1所示。图1 Edge远程在线采集架构图通过调用API在线采集云平台资源适用于公有云部署场景，针对不同云服务提供商（友商）的云资源进行数据采集。使用API接口与其它云服务提供商的系统进行交互，实现数据的在线采集。不需要在源端网络中安装Edge设备。

帮助中心 > 迁移中心 MGC > 产品介绍 > 采集安全性说明
自定义参数说明 - 迁移中心 MGC

Spark应用的Driver内存，参数配置例如：2G, 2048M。该配置项会替换“sc_type”中对应的默认参数，使用时必须带单位，否则会启动失败。父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移
查看并导出执行结果 - 迁移中心 MGC

务执行结果进行过滤，如有过滤，则只导出过滤后的数据。图1 导出执行结果单击“导出管理”按钮，右侧弹出导出管理窗口。当导出进度为导出成功后，单击操作列的“下载”，可以将导出结果下载到本地。图2 下载导出结果父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移
部分表迁移失败，报错：CRC Check failed - 迁移中心 MGC

Check failed 问题描述进行大数据数据迁移时，部分表迁移失败，报错：CRC Check failed 解决方法通过修改DLI作业中迁移sql，将源端timestamp字段类型转成String类型，进行数据迁移。父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据数据迁移
创建目的端连接 - 迁移中心 MGC

创建目的端连接创建执行机连接创建目的端云服务连接创建目的端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
DLI校验任务出现大量失败表 - 迁移中心 MGC

创建并执行DLI校验任务时，出现大量失败表，查看Edge日志报错信息如下：问题分析出现该问题可能是因为请求已达到接口流控上限。解决方法请联系技术支持，提高接口流控的阈值。父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验
创建目的端云服务连接 - 迁移中心 MGC

创建目的端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建目的端连接的大数据云服务包括：数据湖探索（DLI） CloudTable(ClickHouse) CloudTable(HBase) 操作步骤登录迁移中心管理控制台。

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建目的端连接
部分表迁移失败，报错：no more field nodes for for field %s and vector %s - 迁移中心 MGC

vector %s 问题描述进行大数据数据迁移时，部分表迁移失败，报错：no more field nodes for for field %s and vector %s 解决方法基于源端表创建临时表，使用临时表进行数据迁移。父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据数据迁移
创建源端组件连接 - 迁移中心 MGC

创建源端组件连接对大数据组件数据进行一致性校验时，需要与大数据组件建立连接，用于数据查询。目前支持创建源端连接的大数据组件包括： Doris HBase ClickHouse Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建源端连接
准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

准备工作在使用大数据校验功能前，请务必先完成以下必要的准备工作。创建项目通过创建独立的项目，可以将不同的操作场景进行区分和隔离，从而实现更好的组织管理和资源分配。创建方法请参考项目管理。准备迁移工具Edge 在启用大数据校验功能前，需要先在源端环境中安装用于配合大数据校验的迁移工

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知血缘模板需要下载血缘模板，并填写相应数据。父主题：血缘采集

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 血缘采集
创建源端云服务连接 - 迁移中心 MGC

创建源端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建源端连接的大数据云服务包括： MaxCompute 阿里云云数据库ClickHouse 操作步骤登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”，进入

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建源端连接
部署迁移工具Edge - 迁移中心 MGC

部署迁移工具Edge 使用迁移中心的大数据血缘功能前，需要先在可以访问源端元数据来源的环境中部署迁移工具Edge。迁移工具Edge不具备自动重启功能，严禁在任务执行期间重启Edge，以避免任务失败。操作步骤安装Edge的方法请参考下载并安装Edge。安装成功后，将Edge

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 血缘采集
创建执行机连接 - 迁移中心 MGC

创建执行机连接执行机是获取数据的任务执行单元，需要分别与源端和目的端的执行机建立连接，然后执行数据统计，统计结果将用于数据校验。以下大数据组件需要通过创建执行机连接来进行数据校验： Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建目的端连接
查看并导出校验结果 - 迁移中心 MGC

度丢失。并且在处理非常大的数值时，由于浮点数的精度限制，可能会导致实际存在的差异因为超出了Double类型能表示的有效位数而无法被感知到，从而使得差异率计算结果为0。查看校验结果登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”，进入大数据校验页面。在页面左上角的当前项目下拉列表中选择迁移项目。

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
自定义参数说明 - 迁移中心 MGC

COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark.sql.dynamicPartitionOverwrite

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验

总条数： 222

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

血缘采集 - 迁移中心 MGC

如何防止采集数据泄露？ - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

数据采集架构 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

查看并导出执行结果 - 迁移中心 MGC

部分表迁移失败，报错：CRC Check failed - 迁移中心 MGC

创建目的端连接 - 迁移中心 MGC

DLI校验任务出现大量失败表 - 迁移中心 MGC

创建目的端云服务连接 - 迁移中心 MGC

部分表迁移失败，报错：no more field nodes for for field %s and vector %s - 迁移中心 MGC

创建源端组件连接 - 迁移中心 MGC

准备工作 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

创建源端云服务连接 - 迁移中心 MGC

部署迁移工具Edge - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

查看并导出校验结果 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线