搜索_华为云

准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

准备工作在使用大数据校验功能前，请务必先完成以下必要的准备工作。创建大数据迁移项目通过创建独立的项目，可以将不同的操作场景进行区分和隔离，从而实现更好的组织管理和资源分配。创建方法请参考项目管理。准备MgC Agent（原Edge）在启用大数据校验功能前，需要先在源端环境中安装用于配合大数据校验的MgC

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
创建源端云服务连接 - 迁移中心 MGC

创建源端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建源端连接的大数据云服务包括： MaxCompute 阿里云云数据库ClickHouse 操作步骤登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择创建的大数据迁移项目。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建源端连接
创建源端云服务连接 - 迁移中心 MGC

创建源端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建源端连接的大数据云服务包括： MaxCompute 阿里云云数据库ClickHouse 操作步骤登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”，进入

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建源端连接
血缘采集 - 迁移中心 MGC
血缘采集 - 迁移中心 MGC

血缘采集血缘采集概述导出作业创建血缘采集任务查看血缘关系父主题：大数据血缘

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘
血缘采集 - 迁移中心 MGC
血缘采集 - 迁移中心 MGC

血缘采集血缘采集概述导出作业创建血缘采集任务查看血缘关系父主题：大数据血缘

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知 DataArts作业需要提前导出DataArts作业到华为云OBS桶，并将桶的读写权限委托给迁移中心。 SQL作业

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 血缘采集
部署MgC Agent（原Edge） - 迁移中心 MGC

部署MgC Agent（原Edge）使用迁移中心的大数据血缘功能前，需要先在可以访问源端元数据来源的环境中部署MgC Agent。 MgC Agent不具备自动重启功能，严禁在任务执行期间重启MgC Agent，以避免任务失败。操作步骤安装MgC Agent的方法请参考下载并安装MgC

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘
部署迁移工具Edge - 迁移中心 MGC

部署迁移工具Edge 使用迁移中心的大数据血缘功能前，需要先在可以访问源端元数据来源的环境中部署迁移工具Edge。迁移工具Edge不具备自动重启功能，严禁在任务执行期间重启Edge，以避免任务失败。操作步骤安装Edge的方法请参考下载并安装Edge。安装成功后，将Edge

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘
创建目的端组件连接 - 迁移中心 MGC

MySQL节点IP：输入MySQL数据库服务器的IP地址。 MySQL服务端口：输入MySQL数据库服务的端口号。数据库名：输入存储Hive表元数据的数据库名称。说明：请确保填写的MySQL凭证、节点IP、服务端口和数据库名与Hive实际使用的MySQL数据库相匹配，否则会导致数据校验失败。参

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
创建目的端组件连接 - 迁移中心 MGC

MySQL节点IP：输入MySQL数据库服务器的IP地址。 MySQL服务端口：输入MySQL数据库服务的端口号。数据库名：输入存储Hive表元数据的数据库名称。说明：请确保填写的MySQL凭证、节点IP、服务端口和数据库名与Hive实际使用的MySQL数据库相匹配，否则会导致数据校验失败。参

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建目的端连接
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知 DataArts作业需要提前导出DataArts作业到华为云OBS桶，并将桶的读写权限委托给迁移中心。 SQL作业

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

创建源端连接创建源端云服务连接创建源端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
创建目的端云服务连接 - 迁移中心 MGC

创建目的端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建目的端连接的大数据云服务包括：数据湖探索（DLI） CloudTable(ClickHouse) CloudTable(HBase) 操作步骤登录迁移中心管理控制台。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
创建目的端云服务连接 - 迁移中心 MGC

创建目的端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建目的端连接的大数据云服务包括：数据湖探索（DLI） CloudTable(ClickHouse) CloudTable(HBase) 操作步骤登录

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建目的端连接
创建统计任务并执行校验 - 迁移中心 MGC

Delta Lake数据校验任务存在以下约束与限制：源端EMR环境的Spark版本为3.3.1时，支持Delta Lake（有元数据）和Delta Lake（无元数据）的数据校验。源端EMR环境的Spark版本为2.4.8时，仅支持Delta Lake（有元数据）的数据校验。 Hbase校验不支持纯冷数据表。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择创建的大数据迁移项目。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 血缘采集
创建源端连接 - 迁移中心 MGC
创建源端连接 - 迁移中心 MGC

创建源端连接创建源端云服务连接创建源端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
导出作业 - 迁移中心 MGC
导出作业 - 迁移中心 MGC

选择的OBS目录获取导出结果。导出阿里云DataWorks作业登录阿里云DataWorks控制台，单击左侧导航栏的“数据建模与开发 > 数据开发”，在下拉框中选择对应工作空间后单击“进入数据开发”。单击左上方的图标，选择全部产品 > 更多 > 迁移助手，进入迁移助手首页。参考创建和查看Da

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
自定义参数说明 - 迁移中心 MGC

COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark.sql.dynamicPartitionOverwrite

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验

总条数： 244

上一页
1
...
4
5
6
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备工作 - 迁移中心 MGC

创建源端云服务连接 - 迁移中心 MGC

创建源端云服务连接 - 迁移中心 MGC

血缘采集 - 迁移中心 MGC

血缘采集 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

部署MgC Agent（原Edge） - 迁移中心 MGC

部署迁移工具Edge - 迁移中心 MGC

创建目的端组件连接 - 迁移中心 MGC

创建目的端组件连接 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

创建目的端云服务连接 - 迁移中心 MGC

创建目的端云服务连接 - 迁移中心 MGC

创建统计任务并执行校验 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建源端连接 - 迁移中心 MGC

导出作业 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线