搜索_华为云

准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

准备工作在使用大数据校验功能前，请务必先完成以下必要的准备工作。创建项目通过创建独立的项目，可以将不同的操作场景进行区分和隔离，从而实现更好的组织管理和资源分配。创建方法请参考项目管理。准备迁移工具Edge 在启用大数据校验功能前，需要先在源端环境中安装用于配合大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
元数据全量迁移 - 迁移中心 MGC

元数据全量迁移将源端数据库中的所有元数据迁移到华为云数据湖探索（DLI）。元数据迁移不支持事务表（即DDL中带有transactional=true字段的表）。前提条件已完成所有准备工作。已创建源端连接。已创建目的端连接。操作步骤登录迁移中心控制台。在左侧导航

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移 > 迁移实施
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知血缘模板需要下载血缘模板，并填写相应数据。父主题：血缘采集

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 血缘采集
元数据增量感知 - 迁移中心 MGC

元数据增量感知识别出上一次迁移后，在源端数据库中发生变化的元数据，并同步至目的端华为云数据湖探索（DLI）。前提条件已创建源端连接。已创建目的端连接。最少完成一次元数据全量迁移。准备工作开通spark 3.3.1白名单使用该功能前，请联系技术支持人员，将您添加到spark

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移 > 迁移实施
归档存储（冷存储）数据迁移 - 迁移中心 MGC

数据恢复（即解冻）。解冻方式分为“标准解冻”和“加急解冻”，区别如下：标准解冻：适用于对访问时间要求不是特别紧急的情况，解冻耗时大约需要3~5小时。加急解冻：适用于需要快速访问数据的情况，解冻时间可以在1~5分钟内完成，但可能涉及额外的费用。迁移中心的存储工作流提供了自动“

帮助中心 > 迁移中心 MGC > 最佳实践 > 存储迁移相关最佳实践
创建元数据连接 - 迁移中心 MGC

创建元数据连接创建元数据来源类型的连接，获取源端大数据库表清单。目前支持的连接类型，参见表1。表1 支持的元数据连接类型类别连接类型大数据组件 Hive Metastore Doris HBase ClickHouse Delta Lake（有元数据） Delta Lake（无元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 采集元数据
自定义参数说明 - 迁移中心 MGC

自定义参数说明在目的端配置中，支持配置的自定义参数及说明请参见表1和conf参数说明。表1 支持的自定义参数说明参数名称取值范围说明是否必填 spark.dli.metaAccess.enable - 填写true。是 spark.dli.job.agency.name

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移
部署迁移工具Edge - 迁移中心 MGC

部署迁移工具Edge 使用迁移中心的大数据血缘功能前，需要先在可以访问源端元数据来源的环境中部署迁移工具Edge。迁移工具Edge不具备自动重启功能，严禁在任务执行期间重启Edge，以避免任务失败。操作步骤安装Edge的方法请参考下载并安装Edge。安装成功后，将Edge

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘
查看并导出执行结果 - 迁移中心 MGC

查看并导出执行结果每运行一次迁移任务，即会生成一条任务实例。在任务实例的进度详情页面，可以查看并导出任务的执行结果。导出的结果文件可以在生成的15天内下载，15天后自动删除。前提条件已创建迁移任务并运行。操作步骤在任务进度列表，单击进度统计列的“查看”，进入进度详情页面。

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据数据迁移
不使用EIP场景下进行大数据数据迁移 - 迁移中心 MGC

不使用EIP场景下进行大数据数据迁移本节介绍不具备公网场景下Edge通过SNAT/VPN等方式完成大数据迁移和对数的操作方法。本文以阿里云作为源端，Edge安装在阿里云ECS进行举例。步骤一：配置华为云VPN 参考站点入云VPN企业版的华为云控制台操作步骤，分别配置VPN网关、对端网关以及VPN连接。

帮助中心 > 迁移中心 MGC > 最佳实践
DLI校验任务出现大量失败表 - 迁移中心 MGC

DLI校验任务出现大量失败表问题描述创建并执行DLI校验任务时，出现大量失败表，查看Edge日志报错信息如下：问题分析出现该问题可能是因为请求已达到接口流控上限。解决方法请联系技术支持，提高接口流控的阈值。父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验
查看血缘关系 - 迁移中心 MGC
查看血缘关系 - 迁移中心 MGC

查看血缘关系前提条件已创建血缘采集任务，且状态为“已完成”。操作步骤登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“查看血缘图”，进入血缘图页面。通过数据库名、表名

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 血缘采集
创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务前提条件已完成元数据采集。操作步骤登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“创建任务”，弹出创建血缘采集任务窗口。根据实际作业类型，选择文件类型并配置对应参数。

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据血缘 > 血缘采集
创建源端组件连接 - 迁移中心 MGC

创建源端组件连接对大数据组件数据进行一致性校验时，需要与大数据组件建立连接，用于数据查询。目前支持创建源端连接的大数据组件包括： Doris HBase ClickHouse Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建源端连接
查看并导出校验结果 - 迁移中心 MGC

已创建统计任务并执行校验。使用须知当执行求和操作（如sum或allsum）时，如果结果值的位数超过了Double类型的有效位数，会导致精度丢失。并且在处理非常大的数值时，由于浮点数的精度限制，可能会导致实际存在的差异因为超出了Double类型能表示的有效位数而无法被感知到，从而使得差异率计算结果为0。

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
Delta 数据量较大时，如何优化校验任务？ - 迁移中心 MGC

Delta 数据量较大时，如何优化校验任务？本文介绍当源端Delta数据量较大（如超过10000张表）时，如何使用MgC大数据校验功能进行一致性校验的方法。操作步骤参考创建元数据连接，创建第一个Delta元数据连接。使用步骤1.创建的第一个元数据连接，创建元数据同步任务，将源端的元数据同步至迁移中心。

帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验
创建源端云服务连接 - 迁移中心 MGC

创建源端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建源端连接的大数据云服务包括： MaxCompute 阿里云云数据库ClickHouse 操作步骤登录迁移中心管理控制台。在左侧导航栏选择“实施>大数

 帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验 > 创建源端连接
自定义参数说明 - 迁移中心 MGC

自定义参数说明在创建数据湖探索 DLI校验任务时，支持的自定义参数及说明参见表1。表1 DLI校验任务支持的自定义参数说明参数名称默认值描述 mgc.mc2dli.table.partition.enable true DLI表分区为空或者分区不存在时需要通过查询DLI的元数据去判断分区存不存在。

帮助中心 > 迁移中心 MGC > 用户指南 > 大数据校验
大数据-Hive Metastore凭证文件获取方法 - 迁移中心 MGC

大数据-Hive Metastore凭证文件获取方法参考访问FusionInsight Manager登录Manager，进入系统页面。在左侧导航栏，选择“权限>用户”，进入用户页面。在用户列表，选择要在Edge添加凭证的用户，单击操作列“更多>下载认证凭据”，可以下载凭证文件中的krb5

帮助中心 > 迁移中心 MGC > 工具指南 > 常见问题
数据迁移失败，提示超过DLI网管流控上限 - 迁移中心 MGC

数据迁移失败，提示超过DLI网管流控上限问题描述进行大数据数据迁移失败，在数据湖探索的Spark作业查看报错信息为：The throttling thershold has been reached 问题分析出现该问题，是因为您创建的资源数量已达到DLI服务流控限制阈值。解决方法

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据数据迁移

总条数： 328

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备工作 - 迁移中心 MGC

元数据全量迁移 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

元数据增量感知 - 迁移中心 MGC

归档存储（冷存储）数据迁移 - 迁移中心 MGC

创建元数据连接 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

部署迁移工具Edge - 迁移中心 MGC

查看并导出执行结果 - 迁移中心 MGC

不使用EIP场景下进行大数据数据迁移 - 迁移中心 MGC

DLI校验任务出现大量失败表 - 迁移中心 MGC

查看血缘关系 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建源端组件连接 - 迁移中心 MGC

查看并导出校验结果 - 迁移中心 MGC

Delta 数据量较大时，如何优化校验任务？ - 迁移中心 MGC

创建源端云服务连接 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

大数据-Hive Metastore凭证文件获取方法 - 迁移中心 MGC

数据迁移失败，提示超过DLI网管流控上限 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线