检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在页面上方菜单栏选择“集群>Hive”,进入Hive概览页,单击右上角“更多>下载客户端”,弹出下载客户端窗口。 客户端类型选择“仅配置文件”,单击“确定”按钮。 将下载的文件包解压,在/Hive/config文件夹下可以获取core-site.xml、hivemetastore-site
如果源端为MRS Hive且在安全集群下(开启Kerberos认证),还需要在MgC Agent上添加源端Hive Metastore凭证,类型选择“大数据-Hive Metastore”,认证方式选择“用户名/密钥”。凭证文件需要同时上传core-site.xml、hivemetastore-site
Hive校验的sum统计结果显示未达标 问题描述 对Hive进行大数据校验,Hive中的double字段保存的值为 1.7976931348623157E308 和 -1.7976931348623157E308 时 sum 统计结果显示未达标。 问题分析 使用spark-sql
Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” 问题描述 对Hive进行大数据校验,校验任务执行成功,查看校验结果,发现部分字段的“源端数据”和“目的端数据”显示为“0”或“-1”。 问题分析 出现该问题可能是因为数值超出了Hive支持的数值范围。 在数据处理中,
不一致。通常是根据迁移时是否启用kms加密有关, 例如: 源端有KMS加密;未启用kms加密;目的端没有KMS加密;KMS加密状态不一致。 如果目的端已经是预期的KMS加密状态则此报错可以忽略。 如果源端为KMS加密对象则需再次创建迁移工作流勾选上启用KMS加密,解决此类问题。
据校验功能时,需要先选择并启用迁移中心Agent。单击“选择并启用迁移中心Agent”按钮,弹出选择迁移中心Agent窗口。在下拉列表中,选择步骤3.与迁移中心连接成功的MgC Agent。 在进行大数据校验时,请确保MgC Agent一直处于在线并启用状态。 在功能入口区域,单
选择是否启用安全连接。 MetaStore在非安全集群下,可以不启用安全连接。 MetaStore在安全集群下,需要启用安全连接并选择凭证。凭证的获取以及添加方法请参考添加资源凭证中的大数据-Hive Metastore。 Hive版本 选择源端Hive的实际版本。 注意: 如果源端Hive为2
选择是否启用安全连接。 MetaStore在非安全集群下,可以不启用安全连接。 MetaStore在安全集群下,需要启用安全连接并选择凭证。凭证的获取以及添加方法请参考添加资源凭证中的大数据-Hive Metastore。 Hive版本 选择源端Hive的实际版本。 注意: 如果源端Hive为2
大数据校验 新增大数据校验数据连接时,凭证列表数据缺失 Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” Hive校验的sum统计结果显示未达标 DLI校验任务出现大量失败表 Delta 数据量较大时,如何优化校验任务?
如何启用 WinRM 服务 以管理员权限启动PowerShell。 执行如下命令,即可自动启动 WinRM 服务并配置其远程访问设置。 Enable-PSRemoting -Force 父主题: 常见问题
择当前时间之前的时间段进行校验。 支持的源端、目的端组件 源端组件 目的端组件 Hive Hbase Doris MaxCompute ClickHouse Delta Lake Hudi Hive DLI MRS(Doris) MRS(Hbase) MRS(ClickHouse)
MetaStore在非安全集群下,可以不启用安全连接。 MetaStore在安全集群下,需要启用安全连接并选择凭证。凭证的获取以及添加方法请参考添加资源凭证中的大数据-Hive Metastore。 Hive版本 选择目的端Hive的实际版本。 注意: 目前只支持3.x版本。 MetaStore节点IP
MetaStore在非安全集群下,可以不启用安全连接。 MetaStore在安全集群下,需要启用安全连接并选择凭证。凭证的获取以及添加方法请参考添加资源凭证中的大数据-Hive Metastore。 Hive版本 选择目的端Hive的实际版本。 注意: 目前只支持3.x版本。 MetaStore节点IP
表4 Hive Metastore连接参数配置说明 参数 配置说明 所属源 选择源端。 连接名称 默认创建名称为“Hive-Metastore-4位随机数(字母和数字)”,也可以自定义名称。 启用安全连接 选择是否启用安全连接。 MetaStore在非安全集群下,可以不启用安全连接。
表4 Hive Metastore连接参数配置说明 参数 配置说明 所属源 选择源端。 连接名称 默认创建名称为“Hive-Metastore-4位随机数(字母和数字)”,也可以自定义名称。 启用安全连接 选择是否启用安全连接。 MetaStore在非安全集群下,可以不启用安全连接。
cd xxx/ 使用 gunzip 命令来解压对应的归档日志文件,以便查看。例如,归档日志文件名为 archived_log.gz,则可以使用命令 gunzip archived_log.gz 来解压。 查看大数据插件日志 执行如下命令,进入MgC Agent安装目录中的日志目录。
执行机是获取数据的任务执行单元,需要分别与源端和目的端的执行机建立连接,然后执行数据统计,统计结果将用于数据校验。 以下大数据组件需要通过创建执行机连接来进行数据校验: Hive Metastore Delta Lake(有元数据) Delta Lake(无元数据) Hudi(有元数据) Hudi(无元数据) 需
执行机是获取数据的任务执行单元,需要分别与源端和目的端的执行机建立连接,然后执行数据统计,统计结果将用于数据校验。 以下大数据组件需要通过创建执行机连接来进行数据校验: Hive Metastore Delta Lake(有元数据) Delta Lake(无元数据) Hudi(有元数据) Hudi(无元数据) 需
创建并运行元数据同步任务 利用元数据连接,创建元数据同步任务,将源端数据库的库、表、字段信息同步至迁移中心。 支持创建元数据同步任务的连接类型如下: Hive Metastore连接 Doris连接 HBase连接 ClickHouse连接 Hudi(有元数据)连接 Hudi(无元数据)连接 MaxCompute连接
创建并运行元数据同步任务 利用元数据连接,创建元数据同步任务,将源端数据库的库、表、字段信息同步至迁移中心。 支持创建元数据同步任务的连接类型如下: Hive Metastore连接 Doris连接 HBase连接 ClickHouse连接 Hudi(有元数据)连接 Hudi(无元数据)连接 MaxCompute连接