搜索_华为云

准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

准备工作在使用大数据校验功能前，请务必先完成以下必要的准备工作。创建大数据迁移项目通过创建独立的项目，可以将不同的操作场景进行区分和隔离，从而实现更好的组织管理和资源分配。创建方法请参考项目管理。准备MgC Agent（原Edge）在启用大数据校验功能前，需要先在源端环境中安装用于配合大数据校验的MgC

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
查看应用关联分析结果 - 迁移中心 MGC

迁移中心会整理源端资源和应用间的关联关系，并且绘制技术架构图和应用依赖图，为后续迁移计划的制定和目的端架构设计提供帮助。前提条件已导入应用关联文件或导入工具采集结果。查看技术架构图在应用管理页面，单击应用框中的“技术架构图”，可以查看所有服务、微服务、资源的矩阵图。选择服

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 应用管理
Nacos采集器（app-discovery-nacos） - 迁移中心 MGC

Nacos采集器（app-discovery-nacos）用于采集Nacos服务的服务管理和配置管理，采集源端业务架构，实现动态服务发现，解析业务与服务间的关系。参数配置说明参见表1。表1 Nacos采集器参数配置说明参数必选配置说明 output_path 否自定义

 帮助中心 > 迁移中心 MGC > 工具指南 > 工具采集 > 采集器参数配置说明
导出作业 - 迁移中心 MGC
导出作业 - 迁移中心 MGC

选择的OBS目录获取导出结果。导出阿里云DataWorks作业登录阿里云DataWorks控制台，单击左侧导航栏的“数据建模与开发 > 数据开发”，在下拉框中选择对应工作空间后单击“进入数据开发”。单击左上方的图标，选择全部产品 > 更多 > 迁移助手，进入迁移助手首页。参考创建和查看Da

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

创建源端连接创建源端云服务连接创建源端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
创建源端云服务连接 - 迁移中心 MGC

创建源端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建源端连接的大数据云服务包括： MaxCompute 阿里云云数据库ClickHouse 操作步骤登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择创建的大数据迁移项目。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建源端连接
创建统计任务并执行校验 - 迁移中心 MGC

Delta Lake数据校验任务存在以下约束与限制：源端EMR环境的Spark版本为3.3.1时，支持Delta Lake（有元数据）和Delta Lake（无元数据）的数据校验。源端EMR环境的Spark版本为2.4.8时，仅支持Delta Lake（有元数据）的数据校验。 Hbase校验不支持纯冷数据表。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
归档存储（冷存储）数据迁移 - 迁移中心 MGC

归档存储（冷存储）数据迁移背景概述冷存储是一种针对不频繁访问数据的长期备份解决方案，例如，平均一年访问一次的归档存储或平均几年访问一次的深度归档存储。这种存储方式具有高安全性、持久性和成本低等优势。在迁移冷存储数据时，一个主要的考虑因素是数据访问的延迟。由于数据通常处于"冻结"

帮助中心 > 迁移中心 MGC > 最佳实践 > 存储迁移相关最佳实践
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择创建的大数据迁移项目。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 血缘采集
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
创建目的端连接 - 迁移中心 MGC

创建目的端连接创建执行机连接创建目的端云服务连接创建目的端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
自定义参数说明 - 迁移中心 MGC

COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark.sql.dynamicPartitionOverwrite

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

创建源端连接创建源端云服务连接创建源端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
创建源端云服务连接 - 迁移中心 MGC

创建源端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建源端连接的大数据云服务包括： MaxCompute 阿里云云数据库ClickHouse 操作步骤登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”，进入

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建源端连接
创建执行机连接 - 迁移中心 MGC

创建执行机连接执行机是获取数据的任务执行单元，需要分别与源端和目的端的执行机建立连接，然后执行数据统计，统计结果将用于数据校验。以下大数据组件需要通过创建执行机连接来进行数据校验： Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
创建执行机连接 - 迁移中心 MGC

创建执行机连接执行机是获取数据的任务执行单元，需要分别与源端和目的端的执行机建立连接，然后执行数据统计，统计结果将用于数据校验。以下大数据组件需要通过创建执行机连接来进行数据校验： Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建目的端连接
导出作业 - 迁移中心 MGC
导出作业 - 迁移中心 MGC

选择的OBS目录获取导出结果。导出阿里云DataWorks作业登录阿里云DataWorks控制台，单击左侧导航栏的“数据建模与开发 > 数据开发”，在下拉框中选择对应工作空间后单击“进入数据开发”。单击左上方的图标，选择全部产品 > 更多 > 迁移助手，进入迁移助手首页。参考创建和查看Da

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 血缘采集
创建目的端连接 - 迁移中心 MGC

创建目的端连接创建执行机连接创建目的端云服务连接创建目的端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
查看血缘关系 - 迁移中心 MGC
查看血缘关系 - 迁移中心 MGC

登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“查看血缘图”，进入血缘图页面。通过数据库名、表名筛选需要查看的血缘图。如果进行了大数据校验，还可以通过校验批次进行筛选。父主题：血缘采集

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
数据源采集失败，如何重新采集？ - 迁移中心 MGC

数据源采集失败，如何重新采集？采集失败的数据源，处理完失败原因后，需要删除后通过新增数据源重新采集。在任务列表页面，单击采集任务操作列的“查看”，进入任务详情页面。单击采集项操作列的“新增数据源”，弹出新增数据源窗口。选择区域和资源类型，单击“确认”按钮。新增数据源成功，系统开始对新增的数据源进行采集。

帮助中心 > 迁移中心 MGC > 常见问题 > 资源采集

总条数： 245

上一页
1
...
4
5
6
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备工作 - 迁移中心 MGC

查看应用关联分析结果 - 迁移中心 MGC

Nacos采集器（app-discovery-nacos） - 迁移中心 MGC

导出作业 - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

创建源端云服务连接 - 迁移中心 MGC

创建统计任务并执行校验 - 迁移中心 MGC

归档存储（冷存储）数据迁移 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建目的端连接 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

创建源端云服务连接 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

导出作业 - 迁移中心 MGC

创建目的端连接 - 迁移中心 MGC

查看血缘关系 - 迁移中心 MGC

数据源采集失败，如何重新采集？ - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线