检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Delta 数据量较大时,如何优化校验任务? 本文介绍当源端Delta数据量较大(如超过10000张表)时,如何使用MgC大数据校验功能进行一致性校验的方法。 操作步骤 参考创建元数据连接,创建第一个Delta元数据连接。 使用步骤1.创建的第一个元数据连接,创建元数据同步任务,将源端的元数据同步至迁移中心。
填写连接MetaStore的端口,默认为9083。 在元数据采集区域,单击“创建任务 > 元数据同步”按钮,右侧弹出创建任务-元数据同步窗口。 根据元数据同步任务参数配置说明,配置元数据同步任务参数后,单击“确认”按钮,创建元数据同步任务。 表2 元数据同步任务参数配置说明 参数 配置说明 任务名称
填写连接源端ClickHouse集群的外网地址。可以在集群信息页面,查看外网地址。 在元数据采集区域,单击“创建任务 > 元数据同步”按钮,右侧弹出创建任务-元数据同步窗口。 根据元数据同步任务参数配置说明,配置元数据同步任务参数后,单击“确认”按钮,创建元数据同步任务。 表2 元数据同步任务参数配置说明 参数
填写连接源端ClickHouse集群的外网地址。可以在集群信息页面,查看外网地址。 在元数据采集区域,单击“创建任务 > 元数据同步”按钮,右侧弹出创建任务-元数据同步窗口。 根据元数据同步任务参数配置说明,配置元数据同步任务参数后,单击“确认”按钮,创建元数据同步任务。 表2 元数据同步任务参数配置说明 参数
登录迁移中心管理控制台。 在左侧导航栏选择“调研>大数据血缘”,进入大数据血缘页面。在页面左上角的当前项目下拉列表中选择迁移项目。 在元数据采集区域,单击“查看库表清单”,进入元数据采集页面的库表清单页签。 单击“新增数据表”按钮,弹出新增数据表窗口。 根据表1,配置参数。 表1 新增数据表参数说明
以兼容性模式运行程序 Edge设备离线原因 Edge安装完成后,无法启动 如何升级Edge至最新版本? 如何卸载Edge? 如何重启Edge? 如何查询Edge当前版本? 采集失败,提示:The collector is not installed如何处理? 大数据-Hive Metastore凭证文件获取方法
迁移实施 元数据全量迁移 元数据增量感知 全量数据迁移 增量数据迁移 父主题: 大数据数据迁移
查看“http_port”参数获取。 在元数据采集区域,单击“创建任务 > 元数据同步”按钮,右侧弹出创建任务-元数据同步窗口。 根据元数据同步任务参数配置说明,配置元数据同步任务参数后,单击“确认”按钮,创建元数据同步任务。 表2 元数据同步任务参数配置说明 参数 配置说明 任务名称
个可用于访问MgC的IAM用户,本节将介绍如何注册华为账号开通华为云并实名认证,创建IAM用户。 注册华为账号开通华为云并实名认证 请参考以下步骤注册华为账号开通华为云并完成实名认证。如果您已经有一个华为账号,无需重新注册。 访问华为云,单击“注册”。 根据提示信息完成注册开通,
数据源采集失败,如何重新采集? 采集失败的数据源,处理完失败原因后,需要删除后通过新增数据源重新采集。 在任务列表页面,单击采集任务操作列的“查看”,进入任务详情页面。 单击采集项操作列的“新增数据源”,弹出新增数据源窗口。 选择区域和资源类型,单击“确认”按钮。新增数据源成功,系统开始对新增的数据源进行采集。
全量校验:全量对比所有数据,适用于需要对比历史数据的场景。 日级增量校验:依靠元数据中的创建或更新时间,获取数据变化(增量)分区,再进行校验。支持单日或连续多日增量数据的统计,是最常用的校验方式。 小时级增量校验:依靠元数据中的创建或更新时间,获取数据变化(增量)分区,再进行校验。在24小时内
K ,添加方法请参考添加资源凭证。 确保源端账号和目的端账号拥有迁移需要的权限,详细介绍请参见如何获取源端桶和目的端桶权限?。 在华为云创建用于接收源端对象存储数据的OBS桶(即目的端桶),创建方法请参考创建桶。如果您已有目的端桶,则无需重新创建。 为每个待迁移的源端桶,创建一个
创建目的端连接 创建执行机连接 创建目的端云服务连接 创建目的端组件连接 父主题: 大数据校验
Hive校验结果中的源端数据和目的端数据显示为“0”或“-1” 问题描述 对Hive进行大数据校验,校验任务执行成功,查看校验结果,发现部分字段的“源端数据”和“目的端数据”显示为“0”或“-1”。 问题分析 出现该问题可能是因为数值超出了Hive支持的数值范围。 在数据处理中,如果遇到
资源采集常见问题和处理方法 如何查看采集失败原因? 公网采集失败,提示:“网络连接超时”或“其他异常” 数据源采集失败,如何重新采集? 如何获取云平台凭证(AK/SK)? 如何获取添加Azure凭证所需的信息? 如何获取Azure对象存储深度采集所需凭证? 如何配置采集Azure容器资源所需权限?
如何卸载Edge? 卸载Windows版本 卸载Linux版本 父主题: 常见问题
无此状态,如出现该状态,请联系华为云技术支持。 冻结 无此状态,如出现该状态,请联系华为云技术支持。 删除设备 单击设备操作列的“删除”按钮,确认删除当前设备,单击“确认”,即可删除。 如果该设备正在进行资源采集,则设备无法删除。 父主题: 云边协同
Secret。获取方法请参考创建AccessKey。 获取华为云访问密钥(AK/SK) 添加华为云凭证时,需要填写源端资源所在华为云账号或IAM用户的访问密钥(AK/SK,Access Key ID/Secret Access Key)。获取方法请参考新增访问密钥。 获取AWS访问密钥(Access keys)
端厂商进行调整。 目的端 请求QPS和流入流量 观察目的端请求处理速度(QPS)和流入流量,及时发现并应对潜在的性能瓶颈。 通过对比官方资料中提供的阈值,如果QPS或流出流量接近或超过80%-90%的阈值,则需要及时联系目的端厂商进行调整。 对于源端桶和目的端桶,可以在对应的存储
血缘采集 血缘采集概述 创建血缘采集任务 查看血缘关系 父主题: 大数据血缘