搜索_华为云

准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

开通DLI服务Spark 3.3和jar程序访问元数据白名单数据迁移需要使用DLI服务的Spark 3.3特性和jar程序访问DLI元数据特性，请联系DLI服务的技术支持人员申请开通。（可选）开通DLI服务Spark生命周期白名单如果待迁移的元数据有生命周期表（即DDL带有LIFECY

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移
阿里云EMR ClickHouse迁移至MRS ClickHouse数据校验 - 迁移中心 MGC

在元数据采集区域，单击“创建任务 > 元数据同步”按钮，右侧弹出创建任务-元数据同步窗口。根据元数据同步任务参数配置说明，配置元数据同步任务参数后，单击“确认”按钮，创建元数据同步任务。表2 元数据同步任务参数配置说明参数配置说明任务名称默认创建名称为“元数据同步任

 帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验
查看并导出执行结果 - 迁移中心 MGC

务执行结果进行过滤，如有过滤，则只导出过滤后的数据。图1 导出执行结果单击“导出管理”按钮，右侧弹出导出管理窗口。当导出进度为导出成功后，单击操作列的“下载”，可以将导出结果下载到本地。图2 下载导出结果父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移
自定义参数说明 - 迁移中心 MGC

Spark应用的Driver内存，参数配置例如：2G, 2048M。该配置项会替换“sc_type”中对应的默认参数，使用时必须带单位，否则会启动失败。父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移
血缘采集 - 迁移中心 MGC
血缘采集 - 迁移中心 MGC

血缘采集血缘采集概述创建血缘采集任务查看血缘关系父主题：大数据血缘

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘
准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

准备工作在使用大数据校验功能前，请务必先完成以下必要的准备工作。创建项目通过创建独立的项目，可以将不同的操作场景进行区分和隔离，从而实现更好的组织管理和资源分配。创建方法请参考项目管理。准备迁移工具Edge 在启用大数据校验功能前，需要先在源端环境中安装用于配合大数据校验的迁移工

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
部分表迁移失败，报错：CRC Check failed - 迁移中心 MGC

Check failed 问题描述进行大数据数据迁移时，部分表迁移失败，报错：CRC Check failed 解决方法通过修改DLI作业中迁移sql，将源端timestamp字段类型转成String类型，进行数据迁移。父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据数据迁移
公网发现与采集 - 迁移中心 MGC

QPS)等关键性能指标在内的详细信息。不同的数据库类型，采集的信息详情可能有所差异。在源端内网环境中或在可以访问到源端数据库的网络环境中安装Edge工具并与迁移中心连接。在资源采集页面的资源列表，单击数据库资源的资源数量，进入资源列表页面的数据库页签。在数据库资源列表中，通过平台类型过滤出采集到的所

 帮助中心 > 迁移中心 MGC > 用户指南 > 资源采集 > 简单项目
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知血缘模板需要下载血缘模板，并填写相应数据。父主题：血缘采集

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 血缘采集
创建源端组件连接 - 迁移中心 MGC

创建源端组件连接对大数据组件数据进行一致性校验时，需要与大数据组件建立连接，用于数据查询。目前支持创建源端连接的大数据组件包括： Doris HBase ClickHouse Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建源端连接
部署迁移工具Edge - 迁移中心 MGC

部署迁移工具Edge 使用迁移中心的大数据血缘功能前，需要先在可以访问源端元数据来源的环境中部署迁移工具Edge。迁移工具Edge不具备自动重启功能，严禁在任务执行期间重启Edge，以避免任务失败。操作步骤安装Edge的方法请参考下载并安装Edge。安装成功后，将Edge

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

创建源端连接创建源端云服务连接创建源端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
创建源端云服务连接 - 迁移中心 MGC

创建源端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建源端连接的大数据云服务包括： MaxCompute 阿里云云数据库ClickHouse 操作步骤登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”，进入

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建源端连接
部分表迁移失败，报错：no more field nodes for for field %s and vector %s - 迁移中心 MGC

vector %s 问题描述进行大数据数据迁移时，部分表迁移失败，报错：no more field nodes for for field %s and vector %s 解决方法基于源端表创建临时表，使用临时表进行数据迁移。父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据数据迁移
创建统计任务并执行校验 - 迁移中心 MGC

Delta Lake数据校验任务存在以下约束与限制：源端EMR环境的Spark版本为3.3.1时，支持Delta Lake（有元数据）和Delta Lake（无元数据）的数据校验。源端EMR环境的Spark版本为2.4.8时，仅支持Delta Lake（有元数据）的数据校验。 Lin

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 血缘采集
创建目的端连接 - 迁移中心 MGC

创建目的端连接创建执行机连接创建目的端云服务连接创建目的端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
公网发现与采集 - 迁移中心 MGC

选择要发现的源端云平台区域，支持多选。是开启云平台采集，在资源类型下拉列表，勾选需要进行采集的资源类型（采集项）。当前支持采集的云平台和资源类型参见表2。图2 选择资源类型表2 支持采集的资源类型云平台资源类型子类型阿里云主机容器大数据数据库 - 中间件 Redis

帮助中心 > 迁移中心 MGC > 用户指南 > 资源采集 > 复杂项目
创建执行机连接 - 迁移中心 MGC

创建执行机连接执行机是获取数据的任务执行单元，需要分别与源端和目的端的执行机建立连接，然后执行数据统计，统计结果将用于数据校验。以下大数据组件需要通过创建执行机连接来进行数据校验： Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建目的端连接
自定义参数说明 - 迁移中心 MGC

COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark.sql.dynamicPartitionOverwrite

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验

总条数： 179

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备工作 - 迁移中心 MGC

阿里云EMR ClickHouse迁移至MRS ClickHouse数据校验 - 迁移中心 MGC

查看并导出执行结果 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

血缘采集 - 迁移中心 MGC

准备工作 - 迁移中心 MGC

部分表迁移失败，报错：CRC Check failed - 迁移中心 MGC

公网发现与采集 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

创建源端组件连接 - 迁移中心 MGC

部署迁移工具Edge - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

创建源端云服务连接 - 迁移中心 MGC

部分表迁移失败，报错：no more field nodes for for field %s and vector %s - 迁移中心 MGC

创建统计任务并执行校验 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建目的端连接 - 迁移中心 MGC

公网发现与采集 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线