搜索_华为云

创建源端云服务连接 - 迁移中心 MGC

创建源端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建源端连接的大数据云服务包括： MaxCompute 阿里云云数据库ClickHouse 操作步骤登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”，进入

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建源端连接
创建目的端连接 - 迁移中心 MGC

创建目的端连接创建执行机连接创建目的端云服务连接创建目的端组件连接父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
创建元数据连接 - 迁移中心 MGC

MySQL节点IP：输入MySQL数据库服务器的IP地址。 MySQL服务端口：输入MySQL数据库服务的端口号。数据库名：输入存储Hive表元数据的数据库名称。说明：请确保填写的MySQL凭证、节点IP、服务端口和数据库名与Hive实际使用的MySQL数据库相匹配，否则会导致数据校验失败。表3

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 迁移准备 > 采集元数据
查看血缘关系 - 迁移中心 MGC
查看血缘关系 - 迁移中心 MGC

登录迁移中心管理控制台。在左侧导航栏选择“调研>大数据血缘”，进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。在血缘采集区域，单击“查看血缘图”，进入血缘图页面。通过数据库名、表名筛选需要查看的血缘图。如果进行了大数据校验，还可以通过校验批次进行筛选。父主题：血缘采集

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
创建统计任务并执行校验 - 迁移中心 MGC

Delta Lake数据校验任务存在以下约束与限制：源端EMR环境的Spark版本为3.3.1时，支持Delta Lake（有元数据）和Delta Lake（无元数据）的数据校验。源端EMR环境的Spark版本为2.4.8时，仅支持Delta Lake（有元数据）的数据校验。 Hbase校验不支持纯冷数据表。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
创建执行机连接 - 迁移中心 MGC

创建执行机连接执行机是获取数据的任务执行单元，需要分别与源端和目的端的执行机建立连接，然后执行数据统计，统计结果将用于数据校验。以下大数据组件需要通过创建执行机连接来进行数据校验： Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
创建执行机连接 - 迁移中心 MGC

创建执行机连接执行机是获取数据的任务执行单元，需要分别与源端和目的端的执行机建立连接，然后执行数据统计，统计结果将用于数据校验。以下大数据组件需要通过创建执行机连接来进行数据校验： Hive Metastore Delta Lake（有元数据） Delta Lake（无元数据） Hudi（有元数据）

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建目的端连接
自定义参数说明 - 迁移中心 MGC

COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark.sql.dynamicPartitionOverwrite

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
查看并导出校验结果 - 迁移中心 MGC

单击操作列的“下载”，可以将对应表的校验结果下载到本地。导出数据分析报告在校验结果页面，单击“导出 > 导出数据分析 ”按钮，弹出导出数据分析报告窗口。图1 导出数据分析报告选择需要导出日期范围、导出内容，单击“确定”按钮，系统开始导出数据分析报告结果。图2 选择导出的数据报告范围导出完成后，单击“导出管理”按钮，右侧弹出导出管理窗口。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
查看并导出校验结果 - 迁移中心 MGC

度丢失。并且在处理非常大的数值时，由于浮点数的精度限制，可能会导致实际存在的差异因为超出了Double类型能表示的有效位数而无法被感知到，从而使得差异率计算结果为0。查看校验结果登录迁移中心管理控制台。在左侧导航栏选择“实施>大数据校验”，进入大数据校验页面。在页面左上角的当前项目下拉列表中选择迁移项目。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
Hive校验的sum统计结果显示未达标 - 迁移中心 MGC

客户端，进行sql操作，出现用同一个命令存在返回值不同的情况。这是因为在进行大数据对数的求和计算时，由于分布式计算顺序的不确定性，可能会导致计算结果的不一致性。特别是处理接近或等于double类型最大值（1.7976931348623157E+308）的数据时，加上一个较小的数值（如2.0）可能会导致数值溢

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验
创建目的端云服务连接 - 迁移中心 MGC

创建目的端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建目的端连接的大数据云服务包括：数据湖探索（DLI） CloudTable(ClickHouse) CloudTable(HBase) 操作步骤登录迁移中心管理控制台。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
创建目的端云服务连接 - 迁移中心 MGC

创建目的端云服务连接对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建目的端连接的大数据云服务包括：数据湖探索（DLI） CloudTable(ClickHouse) CloudTable(HBase) 操作步骤登录

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建目的端连接
创建目的端组件连接 - 迁移中心 MGC

MySQL节点IP：输入MySQL数据库服务器的IP地址。 MySQL服务端口：输入MySQL数据库服务的端口号。数据库名：输入存储Hive表元数据的数据库名称。说明：请确保填写的MySQL凭证、节点IP、服务端口和数据库名与Hive实际使用的MySQL数据库相匹配，否则会导致数据校验失败。参

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建目的端连接
创建目的端组件连接 - 迁移中心 MGC

MySQL节点IP：输入MySQL数据库服务器的IP地址。 MySQL服务端口：输入MySQL数据库服务的端口号。数据库名：输入存储Hive表元数据的数据库名称。说明：请确保填写的MySQL凭证、节点IP、服务端口和数据库名与Hive实际使用的MySQL数据库相匹配，否则会导致数据校验失败。参

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
如何防止采集数据泄露？ - 迁移中心 MGC

如何防止采集数据泄露？ MgC通过以下方式确保采集数据的安全：数据加密传输：采用加密技术来保护数据在传输过程中的安全本地加密存储凭证：MgC Agent上的凭证信息都会经过加密处理后保存在本地，不会通过网络传输到云端。本地数据采集与存储：通过MgC Agent线下采集的信息

 帮助中心 > 迁移中心 MGC > 常见问题 > 产品咨询
创建并运行元数据同步任务 - 迁移中心 MGC

也可以自定义名称。元数据连接根据实际需求，选择已创建的元数据连接类型。数据库填写需要进行元数据同步的数据库名称。须知：元数据连接为MaxCompute类型时，该参数为必填参数，不能为空。其他元数据连接类型，该参数为可选参数，不填则代表同步全部数据库。并发线程数设置

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 迁移准备 > 采集元数据
创建HBase目的端连接安全集群下的换包操作指南 - 迁移中心 MGC

zookeeper-* 重启MgC Agent。 cd /opt/cloud/Edge/scripts sh start.sh 父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验
归档存储（冷存储）数据迁移 - 迁移中心 MGC

归档存储（冷存储）数据迁移背景概述冷存储是一种针对不频繁访问数据的长期备份解决方案，例如，平均一年访问一次的归档存储或平均几年访问一次的深度归档存储。这种存储方式具有高安全性、持久性和成本低等优势。在迁移冷存储数据时，一个主要的考虑因素是数据访问的延迟。由于数据通常处于"冻结"

帮助中心 > 迁移中心 MGC > 最佳实践 > 存储迁移相关最佳实践
MRS 3.1.0版本普通集群使用YARN模式的换包操作指南 - 迁移中心 MGC

commons-validator* hadoop-h* 重启MgC Agent。 cd /opt/cloud/Edge/scripts sh start.sh 父主题：大数据校验

 帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验

总条数： 243

上一页
1
...
4
5
6
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建源端云服务连接 - 迁移中心 MGC

创建目的端连接 - 迁移中心 MGC

创建元数据连接 - 迁移中心 MGC

查看血缘关系 - 迁移中心 MGC

创建统计任务并执行校验 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

查看并导出校验结果 - 迁移中心 MGC

查看并导出校验结果 - 迁移中心 MGC

Hive校验的sum统计结果显示未达标 - 迁移中心 MGC

创建目的端云服务连接 - 迁移中心 MGC

创建目的端云服务连接 - 迁移中心 MGC

创建目的端组件连接 - 迁移中心 MGC

创建目的端组件连接 - 迁移中心 MGC

如何防止采集数据泄露？ - 迁移中心 MGC

创建并运行元数据同步任务 - 迁移中心 MGC

创建HBase目的端连接安全集群下的换包操作指南 - 迁移中心 MGC

归档存储（冷存储）数据迁移 - 迁移中心 MGC

MRS 3.1.0版本普通集群使用YARN模式的换包操作指南 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线