搜索_华为云

内网采集权限与原理 - 迁移中心 MGC

采集原理：连接数据库，基于数据库的查询语句进行采集。中间件采集权限要求： Redis：使用具有基本访问权限的普通账号即可。 Kafka：需要具备访问所有topic的权限以及对topic的容量等信息进行访问的权限。采集原理：利用Java语言编写的应用程序，集成对应中间件的SDK（Software

帮助中心 > 迁移中心 MGC > 产品介绍 > 采集安全性说明
公网发现与采集 - 迁移中心 MGC

加凭证所需的信息获取方法请参见如何获取添加Azure凭证所需的信息。是区域选择要发现的源端云平台区域，支持多选。是在资源类型下拉列表，勾选需要进行采集的资源类型（采集项）。当前支持采集的云平台和资源类型参见表2。图2 选择要采集的资源类型表2 支持采集的资源类型云平台

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 资源采集 > 简单项目
在线调研 - 迁移中心 MGC
在线调研 - 迁移中心 MGC

Azure认证方式请选择“ID/密钥”。添加凭证所需的信息获取方法请参见如何获取添加Azure凭证所需的信息。是区域选择要发现的源端云平台区域，支持多选。是资源类型在下拉列表，勾选需要进行采集的资源类型（采集项）。当前支持采集的云平台和资源类型参见表2。是应用选择采集到的资源要加入的应用，通过应用可

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 资源采集
公网发现与采集 - 迁移中心 MGC

（可选）选择需要采集的源端云平台服务（仅支持阿里云、腾讯云），获取资源与服务/微服务间的调用关系、关联关系以及依赖关系。选择采集的服务时，需要确保所提供的凭证拥有该服务的相关权限。采集各服务的功能见下表。服务功能资源管理 RM 通过采集该服务可以发现更多应用与资源间的关联线索，防止应用与资源间关系链断裂。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 资源采集 > 复杂项目
自定义参数说明 - 迁移中心 MGC

Spark应用每个Executor的CPU核数。该配置项会替换“sc_type”中对应的默认参数。 numExecutors 1-100 Spark应用Executor的个数。该配置项会替换“sc_type”中对应的默认参数。 executorMemory 1-16 G Spark应用的Executor内存，参数配置例如：2G

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI）
自定义参数说明 - 迁移中心 MGC

Spark应用每个Executor的CPU核数。该配置项会替换“sc_type”中对应的默认参数。 numExecutors 1-100 Spark应用Executor的个数。该配置项会替换“sc_type”中对应的默认参数。 executorMemory 1-16 G Spark应用的Executor内存，参数配置例如：2G

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移
自定义参数说明 - 迁移中心 MGC

配置执行连接时显示所有工作节点的表的最大字节大小。通过将此值设置为“-1”，可以禁用显示。说明：当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据校验
创建元数据连接 - 迁移中心 MGC

执行机凭证选择执行机的登录凭证。凭证的添加方法请参考添加资源凭证中的大数据-执行机。执行机IP 填写连接执行机的IP地址。执行机连接端口填写连接执行机的端口。 Spark客户端目录填写Spark客户端的安装目录路径。环境变量地址填写环境变量文件（配置文件）的绝对路径，例如：

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 采集元数据
自定义参数说明 - 迁移中心 MGC

配置执行连接时显示所有工作节点的表的最大字节大小。通过将此值设置为“-1”，可以禁用显示。说明：当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据校验
创建元数据连接 - 迁移中心 MGC

迁移工具选择在源端环境中部署的迁移工具Edge。执行机凭证选择执行机的登录凭证。凭证的添加方法请参考添加资源凭证中的大数据-执行机。执行机IP 填写连接执行机的IP地址。执行机连接端口填写连接执行机的端口。 Spark客户端目录填写Spark客户端的安装目录路径。环境变量地址

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 采集元数据
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知 DataArts作业需要提前导出DataArts作业到华为云OBS桶，并将桶的读写权限委托给迁移中心。 SQL作业需

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
血缘采集概述 - 迁移中心 MGC
血缘采集概述 - 迁移中心 MGC

血缘采集概述通过血缘采集，可以建立起数据元素之间的关系和依赖关系，从而形成一个清晰的数据血缘图。目前支持血缘采集的文件类型以及采集须知，参见下表。文件类型采集须知 DataArts作业需要提前导出DataArts作业到华为云OBS桶，并将桶的读写权限委托给迁移中心。 SQL作业需

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 血缘采集
增量数据迁移 - 迁移中心 MGC
增量数据迁移 - 迁移中心 MGC

每添加完一个表的信息后，使用回车键换行。完成所有表信息的添加后，保存CSV文件的更改。将编辑并保存好的CSV文件上传至MgC。目的端配置目的端连接选择创建的目的端DLI 通用队列连接。注意：切勿选择DLI SQL队列。自定义参数（可选）根据实际需求进行配置，支持的自定义

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI） > 创建迁移任务
全量数据迁移 - 迁移中心 MGC
全量数据迁移 - 迁移中心 MGC

每添加完一个表的信息后，使用回车键换行。完成所有表信息的添加后，保存CSV文件的更改。将编辑并保存好的CSV文件上传至MgC。目的端配置目的端连接选择创建的目的端DLI 通用队列连接。注意：切勿选择DLI SQL队列。自定义参数（可选）根据实际需求进行配置，支持的自定义

 帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据数据迁移（MaxCompute迁移到DLI） > 创建迁移任务
全量数据迁移 - 迁移中心 MGC
全量数据迁移 - 迁移中心 MGC

每添加完一个表的信息后，使用回车键换行。完成所有表信息的添加后，保存CSV文件的更改。将编辑并保存好的CSV文件上传至MgC。目的端配置目的端连接选择创建的目的端DLI 通用队列连接。注意：切勿选择DLI SQL队列。自定义参数（可选）根据实际需求进行配置，支持的自定义

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移 > 迁移实施
增量数据迁移 - 迁移中心 MGC
增量数据迁移 - 迁移中心 MGC

每添加完一个表的信息后，使用回车键换行。完成所有表信息的添加后，保存CSV文件的更改。将编辑并保存好的CSV文件上传至MgC。目的端配置目的端连接选择创建的目的端DLI 通用队列连接。注意：切勿选择DLI SQL队列。自定义参数（可选）根据实际需求进行配置，支持的自定义

 帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据数据迁移 > 迁移实施
DeltaLake（有元数据）迁移至MRS DeltaLake数据校验 - 迁移中心 MGC

与MgC建立连接的MgC Agent。执行机凭证选择步骤4.在MgC Agent侧添加的源端Delta Lake执行机凭证。执行机IP 填写连接执行机的IP地址。执行机连接端口填写连接执行机的端口，默认为22端口。 Spark客户端目录填写Spark客户端的bin目录的绝对路径

 帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验
创建血缘采集任务 - 迁移中心 MGC

作业ID(JobId) 须知：模板中目标组件类型和上游组件类型支持的类型包括HiveSQL、MaxCompute。模板中单元格不允许存在公式，否则会导致解析失败。模板参数填写完成并保存后，单击窗口的“添加文件”，将填写后的模板文件上传至迁移中心。注意：文件大小不能超过100 MB。

帮助中心 > 迁移中心 MGC > 用户指南 > 新版 > 大数据血缘 > 血缘采集
创建血缘采集任务 - 迁移中心 MGC

作业ID(JobId) 须知：模板中目标组件类型和上游组件类型支持的类型包括HiveSQL、MaxCompute。模板中单元格不允许存在公式，否则会导致解析失败。模板参数填写完成并保存后，单击窗口的“添加文件”，将填写后的模板文件上传至迁移中心。注意：文件大小不能超过100 MB。

帮助中心 > 迁移中心 MGC > 用户指南 > 旧版 > 大数据血缘 > 血缘采集
DeltaLake（无元数据）迁移至MRS DeltaLake数据校验 - 迁移中心 MGC

与MgC建立连接的MgC Agent。执行机凭证选择步骤4.在MgC Agent侧添加的源端Delta Lake执行机凭证。执行机IP 填写连接执行机的IP地址。执行机连接端口填写连接执行机的端口，默认为22端口。 Spark客户端目录填写Spark客户端的bin目录的绝对路径

 帮助中心 > 迁移中心 MGC > 最佳实践 > 大数据迁移后数据校验

总条数： 74

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

内网采集权限与原理 - 迁移中心 MGC

公网发现与采集 - 迁移中心 MGC

在线调研 - 迁移中心 MGC

公网发现与采集 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

创建元数据连接 - 迁移中心 MGC

自定义参数说明 - 迁移中心 MGC

创建元数据连接 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

血缘采集概述 - 迁移中心 MGC

增量数据迁移 - 迁移中心 MGC

全量数据迁移 - 迁移中心 MGC

全量数据迁移 - 迁移中心 MGC

增量数据迁移 - 迁移中心 MGC

DeltaLake（有元数据）迁移至MRS DeltaLake数据校验 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

创建血缘采集任务 - 迁移中心 MGC

DeltaLake（无元数据）迁移至MRS DeltaLake数据校验 - 迁移中心 MGC

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线