检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如果执行策略为Restricted或AllSigned,请通过以下命令临时更改策略,以允许运行本地创建的脚本和已签名的远程脚本。 Set-ExecutionPolicy RemoteSigned -Scope Process 该命令仅在当前PowerShell会话中更改执行策略,并在会话结束后恢复为默认策略。
elta统计任务并执行,方法请参考创建统计任务并执行校验。需要注意,在配置任务时,命令参数中的Spark-submit命令需要配置mgc.delta.metadata.client.ips参数,参数值为所有元数据连接的IP地址和端口,用英文逗号分隔。 例如:mgc.delta.metadata
单击“创建任务”按钮,右侧弹出新建任务窗口,根据待采集资源选择采集器类型,单击“下一步”,进入任务参数配置页面。 在基本参数区域,自定义任务名称;在采集器参数区域,根据采集器参数配置说明,配置采集器参数信息,其中带参数为必填参数。 配置完成后,单击“确认”按钮,采集任务创建完成。在任务列表中可以查看任务的数据源采集状态。
检查迁移准备度配置参数中的“端口”填写是否正确。Windows主机默认为5985端口,Linux主机默认22端口,可根据实际情况修改。 如果端口填写错误,请修改为正确端口后重试。 如果端口填写正确,请继续执行步骤2.。 在安装Edge的主机,打开命令行窗口,使用telnet命令测试源端主
签。 单击列表上方的“添加资源”按钮,弹出添加主机窗口。 图1 添加主机 根据表1,填写相应参数后,单击“确认”,系统会自动检查凭证绑定状态和进行信息采集。 表1 添加主机参数说明 参数 说明 名称 用户自定义 采集设备 选择源端注册的Edge设备。 类型 主机实际系统类型 IP
工具采集 创建工具采集任务 采集器管理 采集器参数配置说明
$SUMMARY_LOG for summary." 根据实际情况,修改脚本中的以下配置项参数: LOG_DIR="/var/log/rollback_hosts" 描述:日志目录路径。 参数默认值:/var/log/rollback_hosts 修改建议:修改为当前用户具有写入权限的目录路径。
$SUMMARY_LOG for summary." 根据实际情况,修改脚本中的以下配置项参数: LOG_DIR="/var/log/update_hosts" 描述:日志目录路径,用于存放运行日志、错误日志和总结日志的文件夹路径。 参数默认值: /var/log/update_hosts 修改建议:修改为当前用户具有写入权限的目录路径。
在资源列表的主机页签,单击列表上方的“添加资源”按钮,弹出添加主机窗口。 图1 添加主机资源 根据表1,填写相应参数后,单击“确认”,系统会自动检查凭证绑定状态和进行信息采集。 表1 添加主机参数说明 参数 说明 名称 用户自定义 采集设备 选择源端注册的Edge设备。 类型 主机实际系统类型 IP
单击页面右上角的“新增连接”,右侧弹出新增连接窗口。 根据实际情况选择执行机类型,单击“下一步”,根据表1,配置执行机参数。 表1 执行机参数配置说明 参数 配置说明 所属源 根据实际情况选择。 须知: CDH执行机只支持源端,MRS执行机支持源端和目的端。 连接名称 默认创建
以管理员权限启动PowerShell。 执行如下命令,即可启用PowerShell远程管理。 Enable-PSRemoting 验证配置。在PowerShell中输入如下命令: New-PSSession 如果配置成功,则该命令会在本地计算机上创建会话,并返回一个会话对象。返回示例:
在DLI管理控制台的左侧导航栏单击“跨源管理”,进入跨源管理页面。 选择“增强型跨源”,单击“创建”,弹出创建连接窗口。 根据表1,配置增强型跨源连接信息。 表1 参数配置说明 参数 配置说明 连接名称 用户自定义 弹性资源池 选择购买的弹性资源池。 虚拟私有云 选择创建的虚拟私有云和子网。 子网 路由表 保持默认。
最佳实践 配置Edge插件JVM参数
源端为Linux系统时需要对安装Edge主机的IP开放22端口。 源端Windows服务器需要关闭防火墙、杀毒软件,并开启winrm服务(在powershell命令窗口中输入winrm quickconfig开启)。 父主题: 主机迁移工作流
(可选)根据表2,配置高级选项。 表2 高级选项参数说明 参数 说明 目的端存储类型 选择迁移到华为云OBS后,对象的存储类型。存储策略说明请参见存储类型介绍。 KMS加密 不勾选,迁移后对象状态与目的端桶级服务端加密状态保持一致。 勾选,所有对象在迁移到OBS桶后都将被加密存储。 说明: 使用
根据表1,配置连接参数后,单击“测试连接”按钮,测试通过代表连接成功。 表1 HBase连接参数配置说明 参数 配置说明 所属源 选择源端。 连接名称 默认创建名称为“HBase-4位随机数(字母和数字)”,也可以自定义名称。 迁移工具 选择步骤3.与MgC建立连接的Edge工具。 HBase凭证
7976931348623157E308 时 sum 统计结果显示未达标。 问题分析 使用spark-sql 客户端,进行sql操作,出现用同一个命令存在返回值不同的情况。 这是因为在进行大数据对数的求和计算时,由于分布式计算顺序的不确定性,可能会导致计算结果的不一致性。特别是处理接近或等于double类型最大值(1
用更多源端连接和迁移工具(Edge)所安装主机的计算资源。 自定义参数 可以通过自定义参数设置同步的特定表或分区、过滤条件等。 如果需要同步的是阿里云 EMR环境中的元数据,请添加如下参数: 参数名:conf 参数值:spark.sql.catalogImplementation=hive
0101 配置参数 *** 为空 查看评估推荐的服务器参数(镜像,磁盘)是否有遗漏,或联系MgC 技术支持人员,查看工作流数据库参数***是否为空。 SMS-Workflow.0102 配置参数 *** 有特殊字符 请联系MgC 技术支持人员,查看工作流数据库参数***是否有特殊字符。
根据表1,配置连接参数后,单击“测试连接”按钮,测试通过代表连接成功。 表1 Delta Lake(无元数据)连接参数配置说明 参数 配置说明 所属源 选择源端。 连接名称 默认创建名称为“Delta-Lake-无元数据-4位随机数(字母和数字)”,也可以自定义名称。 迁移工具 选择步骤3