搜索_华为云

归档存储（冷存储）数据迁移 - 迁移中心 MGC

全迁移，而任务显示成功的现象，影响数据的完整性。为规避这一风险，请谨慎使用“不覆盖”策略。直接覆盖对于源端和目的端存在的同名文件，源端文件直接覆盖目的端文件。对象大小与最后修改时间覆盖对于文件迁移：源端和目的端存在的同名文件，保留最后修改时间较新的文件；如果最后修改时间相

 帮助中心 > 迁移中心 MGC > 最佳实践 > 存储迁移相关最佳实践
Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” - 迁移中心 MGC

Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” 问题描述对Hive进行大数据校验，校验任务执行成功，查看校验结果，发现部分字段的“源端数据”和“目的端数据”显示为“0”或“-1”。问题分析出现该问题可能是因为数值超出了Hive支持的数值范围。在数据处理中，

帮助中心 > 迁移中心 MGC > 常见问题 > 大数据校验
创建表组并添加数据表 - 迁移中心 MGC

每次最多支持导入10,000张表。待导入的表必须属于同一个元数据来源。导入数据表时，系统不会校验数据表加入的分组数量和对数标准。为保持对数的准确性，建议同一数据表加入的分组不超过3个，并避免加入对数标准相同的分组。在创建用于MaxCompute迁移到DLI数据校验的表组时，建议先创建coun

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
创建项目 - 迁移中心 MGC
创建项目 - 迁移中心 MGC

创建项目通过创建独立的项目，可以将不同的操作场景进行区分和隔离，从而实现更好的组织管理和资源分配。包含的项目类型和对应的使用场景说明如下：应用迁移项目：适用于需要进行主机、存储等资源的采集、迁移场景。复杂迁移（大数据迁移）项目：适用于需要进行大数据迁移和大数据一致性校验等复杂数据处理场景。

帮助中心 > 迁移中心 MGC > 快速入门
项目管理 - 迁移中心 MGC
项目管理 - 迁移中心 MGC

功能概述通过创建独立的项目，可以将不同的操作场景进行区分和隔离，从而实现更好的组织管理和资源分配。包含的项目类型和对应的使用场景说明如下：应用迁移项目：适用于需要进行主机、存储等资源的采集、迁移场景。复杂迁移（大数据迁移）项目：适用于需要进行大数据迁移和大数据一致性校验等复杂数据处理场景。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 配置管理
大数据校验概述 - 迁移中心 MGC

MgC为多种大数据计算/存储引擎，如Hive、Hbase、Doris和MaxCompute等，提供了一致性校验方法。通过一致性校验，您可以更加放心地进行大数据迁移操作，确保数据的准确性和可靠性，从而避免了数据丢失或不一致的风险。注意事项创建的源端统计任务和目的端统计任务的统计方式必须保持一致。数据量较大时，对数成功率99

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
大数据校验概述 - 迁移中心 MGC

oris和MaxCompute等，提供了一致性校验方法。通过一致性校验，您可以更加放心地进行大数据迁移操作，确保数据的准确性和可靠性，从而避免了数据丢失或不一致的风险。校验方式说明全量校验：全量对比所有数据，适用于需要对比历史数据的场景。日级增量校验：依靠元数据中的创建或更

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
DeltaLake（无元数据）迁移至MRS DeltaLake数据校验 - 迁移中心 MGC

与MgC建立连接的MgC Agent。执行机凭证选择步骤6.在MgC Agent侧添加的源端Delta Lake执行机凭证。执行机IP 填写连接执行机的IP地址。执行机连接端口填写连接执行机的端口，默认为22端口。 Spark客户端目录填写Spark客户端的bin目录的绝对路径

 帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验
配置OBS桶 - 迁移中心 MGC
配置OBS桶 - 迁移中心 MGC

设置用于存放大数据校验任务日志文件和内容校验结果的OBS桶（以下称为日志桶），实现对日志和内容校验结果的有效管理和分析。设置了日志桶后，会默认使用大数据校验中的日志上传功能，将日志数据和内容校验结果上传到指定的OBS桶中。权限要求请确保添加的目的端凭证最少拥有日志桶的如下操作权限：

帮助中心 > 迁移中心 MGC > 迁移中心Agent操作指南 > 云边协同
准备工作 - 迁移中心 MGC
准备工作 - 迁移中心 MGC

在使用大数据校验功能前，请务必先完成以下必要的准备工作。创建项目通过创建独立的项目，可以将不同的操作场景进行区分和隔离，从而实现更好的组织管理和资源分配。创建方法请参考项目管理。准备迁移工具Edge 在启用大数据校验功能前，需要先在源端环境中安装用于配合大数据校验的迁移工具Edge。大数据校

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
创建统计任务并执行校验 - 迁移中心 MGC

创建统计任务并执行校验利用创建的源端连接和目的端连接，分别创建源端和目的端统计任务，获取源端和目的端的数据信息，以便于进行数据校验。支持的大数据组件和统计方式说明请参见大数据校验概述。注意事项创建的源端统计任务和目的端统计任务的统计方式必须保持一致。 HBase安全集群任

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
创建统计任务并执行校验 - 迁移中心 MGC

创建统计任务并执行校验利用创建的源端连接和目的端连接，分别创建源端和目的端统计任务，获取源端和目的端的数据信息，以便于进行数据校验。支持的大数据组件和统计方式说明请参见大数据校验概述。注意事项创建的源端统计任务和目的端统计任务的统计方式必须保持一致。数据量较大时，对数成功率99

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
MRS HBase迁移至MRS HBase数据校验 - 迁移中心 MGC

MgC进行数据一致性校验的步骤和方法。准备工作需要先在源端内网环境中安装用于配合数据校验的工具MgC Agent（原Edge）并注册用户，方法请参见安装Linux版本的MgC Agent。需要将源端和目的端所有节点的主机名和IP地址映射添加到安装MgC Agent主机的/etc/hosts文件中，配置连接才能连接成功。

帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知 DataArts作业需要提前导出DataArts作业到华为云OBS桶，并将桶的读写权限委托给迁移中心。 SQL作业需

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 迁移准备 > 血缘采集
创建目的端云服务连接 - 迁移中心 MGC

se)集群的凭证。凭证的添加方法请参考添加资源凭证中的大数据-ClickHouse。认证方式选择“用户名/密码”，填写在CloudTable服务创建的目的端ClickHouse集群的登录用户名和密码。数据库链接填写连接到CloudTable(ClickHouse)的数据库链接

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
创建目的端云服务连接 - 迁移中心 MGC

区域ID 输入需要校验的数据（即目的端数据）所在区域的代码。例如：ap-southeast-1。可以参考终端节点获取不同区域的区域代码信息。项目ID 输入需要校验的数据所在的项目ID。获取方法请参考获取项目的名称和ID。队列名称输入需要进行校验的DLI队列名称。队列类型必须是SQL队列。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建目的端连接
创建源端云服务连接 - 迁移中心 MGC

选择源端阿里云账号的凭证。凭证的添加方式请参考添加资源凭证，类型选择“大数据-MaxCompute”。项目名称输入需要采集的MaxCompute项目名称。项目名称可在MaxCompute侧控制台获取。 Endpoint 输入MaxCompute服务所在地域的Endpoint信息。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建源端连接
创建执行机连接 - 迁移中心 MGC

选择执行机的登录凭证。凭证的添加方法请参考添加资源凭证中的大数据-执行机。执行机IP 填写连接执行机的IP地址。执行机连接端口填写连接执行机的端口，默认为22端口。安装目录填写MRS/CDH客户端的安装目录路径。即安装客户端时，“./install.sh” 所填写的地址。 SQL文件地址

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验 > 创建目的端连接
创建执行机连接 - 迁移中心 MGC

执行机IP 填写连接执行机的IP地址。执行机连接端口填写连接执行机的端口，默认为22端口。安装目录填写MRS/CDH客户端的安装目录路径。即安装客户端时，“./install.sh” 所填写的地址。 SQL文件地址填写用于存放执行作业时生成的SQL文件的文件夹地址。您需要拥有该文件夹的读写权限。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建目的端连接
创建源端云服务连接 - 迁移中心 MGC

对大数据云服务数据进行一致性校验时，需要分别与源端和目的端云服务建立连接，用于数据查询和计算。目前支持创建源端连接的大数据云服务包括： MaxCompute 阿里云云数据库ClickHouse 操作步骤登录迁移中心管理控制台。在左侧导航栏的项目下拉列表中选择创建的大数据迁移项目。在左侧导航栏选

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验 > 创建源端连接

总条数： 290

上一页
1
2
3
4
5
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

归档存储（冷存储）数据迁移 - 迁移中心 MGC

Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” - 迁移中心 MGC

创建表组并添加数据表 - 迁移中心 MGC

创建项目 - 迁移中心 MGC

项目管理 - 迁移中心 MGC

大数据校验概述 - 迁移中心 MGC

大数据校验概述 - 迁移中心 MGC

DeltaLake（无元数据）迁移至MRS DeltaLake数据校验 - 迁移中心 MGC

配置OBS桶 - 迁移中心 MGC

准备工作 - 迁移中心 MGC

创建统计任务并执行校验 - 迁移中心 MGC

创建统计任务并执行校验 - 迁移中心 MGC

MRS HBase迁移至MRS HBase数据校验 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

创建目的端云服务连接 - 迁移中心 MGC

创建目的端云服务连接 - 迁移中心 MGC

创建源端云服务连接 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

创建执行机连接 - 迁移中心 MGC

创建源端云服务连接 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线