检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
将编辑并保存好的CSV文件上传至MgC。 目的端配置 目的端连接 选择创建的目的端DLI SQL队列连接。 注意: 切勿选择通用队列。 自定义参数 根据实际需求进行配置,支持的自定义参数详情请参考conf参数说明和自定义参数说明。 迁移选项 并发连接数 设置迁移并发数。默认为3,1≤取值范围≤10。 配置完成后,选择任务的运行方式。
根据实际情况选择执行机类型,单击“下一步”,根据表1,配置执行机参数。 表1 执行机参数配置说明 参数 配置说明 所属源 根据实际情况选择。 须知: CDH执行机只支持源端,MRS执行机支持源端和目的端。 连接名称 默认创建名称为“执行机类型-4位随机数(字母和数字)”,也可以自定义名称。 执行机凭证
日志桶参数配置说明 参数 配置说明 桶类型 支持并行文件系统和标准桶两种类型。 对象存储终端节点 填写日志桶所在区域的终端节点(Endpiont),获取方法请参见地区和终端节点。单击“校验”,获取桶列表。 桶名称 在下拉列表中,选择需要作为日志桶的桶名。 自定义文件夹(可选) 指定日志文件
采集七牛云存储资源所需的权限参见下表。 资源类型 云服务 Action 最小权限策略 存储 对象存储(Kodo) kodo:buckets QiniuKodoReadOnlyAccess 金山云资源采集 采集金山云存储资源所需的权限参见下表。 资源类型 云服务 Action 最小权限策略
指定时间校验参数配置说明 表1 全量校验参数配置说明 区域 参数 配置说明 基础信息 任务名 默认创建名称为“组件类型全量校验-4位随机数(字母和数字)”,也可以自定义名称。 任务配置 表组 选择需要校验的表所在表组。 执行机连接 Hive、Delta Lake和Hudi组件配置参数。
单击“采集设备”或“凭证”后的“配置”,弹出配置窗口。 根据表1,配置参数。 表1 迁移准备度参数配置说明 参数 配置说明 类型 根据实际的主机操作系统类型选择。 采集设备 选择在源端环境安装的Edge工具。当资源较多时,可以同时勾选多个资源,并通过列表上方的“绑定采集设备”进行批量绑定。
在进行大数据数据迁移时,请确保迁移工具Edge一直处于在线并启用状态。 启用迁移工具Edge后,单击页面右上角的“创建源端连接”按钮,右侧弹出创建连接窗口。 连接类型选择“MaxCompute”,单击“下一步”。 根据MaxCompute连接参数配置说明,配置连接参数后,单击“测试连接”按钮,测试通过代表连接成功。
小不能超过15MB。将CSV文件编码转换为UTF-8的方法请参考转换CSV文件编码为UTF-8。 在资源类型下拉列表中,选择要导入的资源类型,并上传对应的资源清单。 资源类型 操作步骤 主机 单击资源清单后的“添加文件”,将导出的阿里云ECS实例资源清单上传。 实例资源清单上传后
小不能超过15MB。将CSV文件编码转换为UTF-8的方法请参考转换CSV文件编码为UTF-8。 在资源类型下拉列表中,选择要导入的资源类型,并上传对应的资源清单。 资源类型 操作步骤 主机 单击资源清单后的“添加文件”,将导出的阿里云ECS实例资源清单上传。 实例资源清单上传后
表1 存储迁移通用约束与限制 类别 约束与限制 多版本对象迁移 默认只迁移源端多版本对象中的最新版本,不支持迁移历史版本的对象存储数据。 目的端桶存储类别 目的端桶的存储类别只能为标准存储或者低频访问存储。迁移完成后,可以自行修改桶的存储类别。 迁移对象 对象名称不能包含特殊字符。
数据采集架构 迁移中心(MgC)采集数据的方式主要包括以下两种: 利用Edge远程在线采集 通过调用API在线采集云平台资源 利用Edge远程在线采集 适用于公有云、私有云(如VMware、Hyper-V等虚拟化环境)以及数据中心(IDC)部署,或者以上部署方式的混合场景。迁移中心
当执行求和操作(如sum或allsum)时,如果结果值的位数超过了Double类型的有效位数,会导致精度丢失。并且在处理非常大的数值时,由于浮点数的精度限制,可能会导致实际存在的差异因为超出了Double类型能表示的有效位数而无法被感知到,从而使得差异率计算结果为0。 查看校验结果 登录迁移中心管理控制台。
建的迁移项目。 单击页面右上角的“连接管理”按钮,进入连接管理页面。 单击页面右上角的“创建目的端连接”按钮,右侧弹出新增连接窗口。 连接类型选择“数据湖探索 (DLI)”,单击“下一步”,进入详细配置页面。 根据DLI服务参数配置说明,配置连接参数后,单击“测试连接”按钮,测试通过代表连接成功。
目的端配置 目的端连接 选择创建的目的端DLI 通用队列连接。 注意: 切勿选择DLI SQL队列。 自定义参数 根据实际需求进行配置,支持的自定义参数详情请参考conf参数说明和自定义参数说明。 如果是公网迁移,需要填写以下4个参数: spark.dli.metaAccess.enable:填写true。
构图、服务依赖图和包含的微服务列表。 查看应用列表 在应用管理页面的应用列表,可以查看项目下的所有应用。通过应用列表可以查看应用名称、应用类型、所属业务领域、包含微服务数量以及依赖应用和被依赖应用数量等信息。 单击包含微服务列的数量,可以查看该应用所包含的微服务列表。 单击依赖应
已下载并安装Edge,并完成用户注册。 离线升级 使用注册的用户名、密码登录Edge控制台,在左侧导航树选择“采集工具管理”,进入应用关联采集器页面。 可以查看已安装的采集器类型、版本以及安装路径等信息。 在迁移中心管理控制台的迁移工具页面,下载最新版本的采集器安装包,并放入Edge安装目录的根目录下(如C:\Ed
目的端配置 目的端连接 选择创建的目的端DLI 通用队列连接。 注意: 切勿选择DLI SQL队列。 自定义参数 根据实际需求进行配置,支持的自定义参数详情请参考conf参数说明和自定义参数说明。 如果是公网迁移,需要填写以下4个参数: spark.dli.metaAccess.enable:填写true。
绑定目的端 仅支持主机类型资源绑定目的端。如果您已经在华为云创建了目的端主机,可以将采集的源端主机与目的端主机进行绑定,绑定后, 迁移工作流将使用所绑定的目的端作为迁移的目的端。 绑定目的端的主机,在创建迁移工作流前,无需进行评估推荐。 前提条件 已完成资源采集。 注意事项 绑定的目的端主机有以下要求:
企业版-VPN连接”。 单击“创建VPN连接”,选择已创建的VPN网关和对端网关,并填入对端网关的子网地址(确保子网地址不重合)。 策略配置选择“自定义配置”,并确保配置信息与阿里云侧保持一致,以确保连通性。 配置完成后,单击“立即购买”。 步骤二:配置阿里云VPN 参考站点入云VPN企业
\config\nodes.csv。 如果使用自定义的配置文件,请参考默认配置文件(nodes.csv)创建新的csv文件。该参数填写新建的csv文件存放路径。 须知: 建议使用采集器提供的默认节点接入配置文件进行采集,如果需要自定义配置文件,请参考默认配置文件(nodes.csv)进行创建。