检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击“创建任务”按钮,右侧弹出新建任务窗口,根据待采集资源选择采集器类型,单击“下一步”,进入任务参数配置页面。 在基本参数区域,自定义任务名称;在采集器参数区域,根据采集器参数配置说明,配置采集器参数信息,其中带参数为必填参数。 配置完成后,单击“确认”按钮,采集任务创建完成。在任务列表中可以查看任务的数据源采集状态。
选择存储迁移标准模板,单击“开始配置”按钮,进行工作流配置。 根据表1,配置基础信息参数。 表1 基础信息参数配置说明 参数 说明 名称 用户自定义。 区域 在下拉菜单中选择目的端桶所在区域。 描述 用户自定义。 集群 选择在完成准备工作时,创建的集群作为迁移集群。 根据表2、表3,配置源端、目的端信息。
在左侧导航栏单击“迁移中心Agent”,进入迁移中心Agent页面。 在Linux版区域,单击“下载安装包”或“复制下载命令”,将MgC Agent安装包下载到Linux主机。 安装最新下载的MgC Agent,方法请参考安装Linux版本MgC Agent。 父主题: 如何升级MgC Agent(原Edge)至最新版本?
移中心Agent页面。 在Windows版区域,单击“下载安装包”,将最新版本的MgC Agent安装程序下载到Windows主机。 双击最新版本的MgC Agent安装程序,开始安装,覆盖旧版本的MgC Agent。安装完成后,前往MgC控制台,在设备列表中确认设备的版本已更新为最新版本。
需要分开执行校验任务,确保一个任务执行完成后才能执行另一个任务。 在进行对数任务时,不支持使用 MRS 3.3.0 及以上版本集群节点的ECS作为执行机,会导致对数任务执行失败。 约束与限制 创建EMR Delta Lake到MRS Delta Lake数据校验任务存在以下约束与限制:
在列表上方选择“目标场景>主机迁移”,此时源端迁移准备度列会出现“配置”按钮。 单击源端迁移准备度列的“配置”,弹出配置窗口。 根据表2,配置参数。 表2 迁移准备度参数配置说明 参数 配置说明 类型 根据实际的主机操作系统类型选择。 迁移中心Agent绑定 选择在源端环境安装的MgC Agent。 接入IP
手动添加 适用于采集本地主机和暂不支持公网、内网采集的云平台主机。 前提条件 已在源端内网环境安装MgC Agent,并与迁移中心连接。 已在MgC Agent上添加源端主机凭证。为确保采集过程具备充分的系统访问权限,主机凭证要求如下: Linux主机,请添加Root账号和密码作为采集凭证。
后仅对当前工作流生效,不会修改迁移方案中配置的集群。 根据表1,进行迁移配置。 表1 迁移配置参数说明 参数 子参数 说明 并发子任务数 - 用户自定义。配置的数目不能超过可用迁移节点数x10。例如:可用的迁移节点数为2,则最大子任务数配置数目需要≤20。 同名覆盖方式 不覆盖
框中,单击“去配置”,弹出配置窗口。 如果性能采集列的“开始”按钮未置灰,代表已完成配置,可以跳过此步执行步骤7。 根据表1,配置参数。 表1 迁移准备度参数配置说明 参数 配置说明 类型 根据实际的主机操作系统类型选择。 迁移中心Agent绑定 选择在源端环境安装的MgC Agent。
组件选择“数据湖探索 DLI”,任务类型选择“元数据增量感知”,单击“下一步”,进入详细配置页面。 根据表1,配置元数据增量感知任务参数。 表1 元数据增量感知参数配置说明 区域 参数 配置说明 基本信息 任务名称 默认创建名称为“MaxCompute到DLI元数据增量感知-4位
步骤添加华为云凭证。 在MgC Agent(原Edge)控制台的总览页面,单击页面右上角的“查看配置”按钮,右侧弹出连接配置窗口。 在华为云账号框中,单击“配置”按钮。 在弹出的配置华为云凭证窗口,输入目的端华为云账号的AK/SK,单击“确认”,完成添加。 修改华为云凭证 如果您
在元数据采集区域,单击“创建任务 > 数据湖元数据同步”按钮,右侧弹出创建任务-数据湖元数据同步窗口。 根据表1,配置数据湖元数据同步任务参数。 表1 元数据同步任务参数配置说明 参数 配置说明 任务名称 默认创建名称为“数据湖元数据同步任务-4位随机数(字母和数字)”,也可以自定义名称。 元数据连接
为需要进行性能采集的主机配置采集设备和凭证。 如果性能采集列的“开始”按钮置灰,将鼠标移动到“开始”按钮处,在弹出的提示框中,单击“去配置”,弹出配置窗口。 如果性能采集列的“开始”按钮未置灰,代表已完成配置,可以跳过此步执行步骤7。 根据表1,配置参数。 表1 迁移准备度参数配置说明 参数 配置说明
后仅对当前工作流生效,不会修改迁移方案中配置的集群。 根据表1,进行迁移配置。 表1 迁移配置参数说明 参数 子参数 说明 并发子任务数 - 用户自定义。配置的数目不能超过可用迁移节点数x10。例如:可用的迁移节点数为2,则最大子任务数配置数目需要≤20。 同名覆盖方式 不覆盖
单击页面右上角的“新增连接”,右侧弹出新增连接窗口。 根据实际情况选择执行机类型,单击“下一步”,根据表1,配置执行机参数。 表1 执行机参数配置说明 参数 配置说明 所属源 根据实际情况选择。 须知: CDH执行机只支持源端,MRS执行机支持源端和目的端。 连接名称 默认创
为需要进行性能采集的主机配置采集设备和凭证。 如果性能采集列的“开始”按钮置灰,将鼠标移动到“开始”按钮处,在弹出的提示框中,单击“去配置”,弹出配置窗口。 如果性能采集列的“开始”按钮未置灰,代表已完成配置,可以跳过此步执行步骤7。 根据表1,配置参数。 表1 迁移准备度参数配置说明 参数 配置说明
后仅对当前工作流生效,不会修改迁移方案中配置的集群。 根据表1,进行迁移配置。 表1 迁移配置参数说明 参数 子参数 说明 并发子任务数 - 用户自定义。配置的数目不能超过可用迁移节点数x10。例如:可用的迁移节点数为2,则最大子任务数配置数目需要≤20。 同名覆盖方式 不覆盖
选择存储迁移标准模板,单击“开始配置”按钮,进行工作流配置。 根据表1,配置基础信息参数。 表1 基础信息参数说明 参数 说明 名称 用户自定义。 区域 下拉菜单中选择目的端所在区域。 描述 用户自定义。 集群 选择创建的集群作为迁移集群。 根据表2、表3,配置源端、目的端信息。 表2 源端信息参数说明
选择“连接管理”,单击“创建连接”,右侧弹出新增连接窗口。 图1 创建连接 根据实际情况选择执行机类型,单击“下一步”,根据表1,配置执行机参数。 表1 执行机参数配置说明 参数 配置说明 所属源 根据实际情况选择。 须知: CDH执行机只支持源端,MRS执行机支持源端和目的端。 连接名称 默认创
连接类型选择“MaxCompute”,单击“下一步”。 根据MaxCompute连接参数配置说明,配置连接参数后,单击“测试连接”按钮,测试通过代表连接成功。 表1 MaxCompute连接参数配置说明 参数 配置说明 所属源 选择源端。 连接名称 默认创建名称为“MaxCompute-4位