搜索_华为云

自定义参数说明 - 迁移中心 MGC

Spark应用的Driver内存，参数配置例如：2G, 2048M。该配置项会替换“sc_type”中对应的默认参数，使用时必须带单位，否则会启动失败。父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移
阿里云EMR ClickHouse迁移至MRS ClickHouse数据校验 - 迁移中心 MGC

在元数据采集区域，单击“创建任务 > 元数据同步”按钮，右侧弹出创建任务-元数据同步窗口。根据元数据同步任务参数配置说明，配置元数据同步任务参数后，单击“确认”按钮，创建元数据同步任务。表2 元数据同步任务参数配置说明参数配置说明任务名称默认创建名称为“元数据同步任

 帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验
查看并导出执行结果 - 迁移中心 MGC

务执行结果进行过滤，如有过滤，则只导出过滤后的数据。图1 导出执行结果单击“导出管理”按钮，右侧弹出导出管理窗口。当导出进度为导出成功后，单击操作列的“下载”，可以将导出结果下载到本地。图2 下载导出结果父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移
如何获取云平台凭证（AK/SK）？ - 迁移中心 MGC

如何获取云平台凭证（AK/SK）？本节为您介绍如何获取添加云平台凭证所需的认证信息（访问密钥）。获取阿里云访问密钥(AccessKey) 添加阿里云凭证时，需要填写源端资源所在的阿里云账号或RAM用户的AccessKey ID和AccessKey Secret。获取方法请参考创建AccessKey。

帮助中心 > 迁移中心 MGC > 常见问题 > 资源采集
准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

准备工作在使用大数据校验功能前，请务必先完成以下必要的准备工作。创建项目通过创建独立的项目，可以将不同的操作场景进行区分和隔离，从而实现更好的组织管理和资源分配。创建方法请参考项目管理。准备迁移工具Edge 在启用大数据校验功能前，需要先在源端环境中安装用于配合大数据校验的迁移工

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
血缘采集 - 迁移中心 MGC
血缘采集 - 迁移中心 MGC

血缘采集血缘采集概述创建血缘采集任务查看血缘关系父主题：大数据血缘

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘
部分表迁移失败，报错：CRC Check failed - 迁移中心 MGC

Check failed 问题描述进行大数据数据迁移时，部分表迁移失败，报错：CRC Check failed 解决方法通过修改DLI作业中迁移sql，将源端timestamp字段类型转成String类型，进行数据迁移。父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据数据迁移
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

创建源端连接创建源端云服务连接创建源端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
创建源端组件连接 - 迁移中心 MGC

创建源端组件连接对大数据组件数据进行一致性校验时，需要与大数据组件建立连接，用于数据查询。目前支持创建源端连接的大数据组件包括： Doris HBase ClickHouse Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建源端连接
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知血缘模板需要下载血缘模板，并填写相应数据。父主题：血缘采集

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 血缘采集
部署迁移工具Edge - 迁移中心 MGC

部署迁移工具Edge 使用迁移中心的大数据血缘功能前，需要先在可以访问源端元数据来源的环境中部署迁移工具Edge。迁移工具Edge不具备自动重启功能，严禁在任务执行期间重启Edge，以避免任务失败。操作步骤安装Edge的方法请参考下载并安装Edge。安装成功后，将Edge

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘
部分表迁移失败，报错：no more field nodes for for field %s and vector %s - 迁移中心 MGC

vector %s 问题描述进行大数据数据迁移时，部分表迁移失败，报错：no more field nodes for for field %s and vector %s 解决方法基于源端表创建临时表，使用临时表进行数据迁移。父主题：大数据数据迁移

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据数据迁移
公网发现与采集 - 迁移中心 MGC

QPS)等关键性能指标在内的详细信息。不同的数据库类型，采集的信息详情可能有所差异。在源端内网环境中或在可以访问到源端数据库的网络环境中安装Edge工具并与迁移中心连接。在资源采集页面的资源列表，单击数据库资源的资源数量，进入资源列表页面的数据库页签。在数据库资源列表中，通过平台类型过滤出采集到的所

 帮助中心 > 迁移中心 MGC > 用户指南 > 资源采集 > 简单项目
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 血缘采集
创建目的端连接 - 迁移中心 MGC

创建目的端连接创建执行机连接创建目的端云服务连接创建目的端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
创建源端云服务连接 - 迁移中心 MGC

创建源端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建源端连接的大数据云服务包括： MaxCompute 阿里云云数据库ClickHouse 操作步骤登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”，进入

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建源端连接
创建统计任务并执行校验 - 迁移中心 MGC

Delta Lake数据校验任务存在以下约束与限制：源端EMR环境的Spark版本为3.3.1时，支持Delta Lake（有元数据）和Delta Lake（无元数据）的数据校验。源端EMR环境的Spark版本为2.4.8时，仅支持Delta Lake（有元数据）的数据校验。 Lin

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
自定义参数说明 - 迁移中心 MGC

COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark.sql.dynamicPartitionOverwrite

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
查看并导出校验结果 - 迁移中心 MGC

度丢失。并且在处理非常大的数值时，由于浮点数的精度限制，可能会导致实际存在的差异因为超出了Double类型能表示的有效位数而无法被感知到，从而使得差异率计算结果为0。查看校验结果登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”，进入大数据校验页面。在页面左上角的当前项目下拉列表中选择迁移项目。

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
查看血缘关系 - 迁移中心 MGC
查看血缘关系 - 迁移中心 MGC

登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“查看血缘图”，进入血缘图页面。通过数据库名、表名筛选需要查看的血缘图。如果进行了大数据校验，还可以通过校验批次进行筛选。父主题：血缘采集

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 血缘采集

总条数： 179

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自定义参数说明 - 迁移中心 MGC

阿里云EMR ClickHouse迁移至MRS ClickHouse数据校验 - 迁移中心 MGC

查看并导出执行结果 - 迁移中心 MGC

如何获取云平台凭证（AK/SK）？ - 迁移中心 MGC

准备工作 - 迁移中心 MGC

血缘采集 - 迁移中心 MGC

部分表迁移失败，报错：CRC Check failed - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

创建源端组件连接 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

部署迁移工具Edge - 迁移中心 MGC

部分表迁移失败，报错：no more field nodes for for field %s and vector %s - 迁移中心 MGC

公网发现与采集 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建目的端连接 - 迁移中心 MGC

创建源端云服务连接 - 迁移中心 MGC

创建统计任务并执行校验 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

查看并导出校验结果 - 迁移中心 MGC

查看血缘关系 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线