检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
”参数获取。 数据库名 填写源端Doris数据库名称。 采集资源使用信息 可选参数。开启后,通过该连接创建的统计任务将收集大数据服务的资源使用信息,这些信息将用于MgC上的报告生成,以便于进行性能优化。 须知: 使用该功能,需要MgC Agent添加的华为云账号AK/SK拥有MR
资源的安全性,有关IAM的详细介绍请参见IAM用户。此处介绍如何创建一个具有MgC使用权限的IAM用户。若您不需要使用IAM用户,可以略过此部分内容。 访问华为云,单击页面右上角的“控制台”,使用注册账号登录控制台。 在“控制台”页面,将鼠标移动至右上方的用户名,在下拉列表中选择“统一身份认证”。
Nginx配置文件采集器(app-discovery-nginx) 根据Nginx下的config文件,解析获取Nginx的跳转信息。参数配置说明参见表1。 表1 Nginx配置文件采集器参数配置说明 参数 必选 配置说明 output_path 否 自定义采集结果(app-discovery-nginx-xxx
> 全部配置”,搜索“https_port”参数获取。 采集资源使用信息 可选参数。开启后,通过该连接创建的统计任务将收集大数据服务的资源使用信息,这些信息将用于MgC上的报告生成,以便于进行性能优化。 须知: 使用该功能,需要MgC Agent添加的华为云账号AK/SK拥有MR
注意任务配置中的表组,选择步骤20.创建的表组。 任务类型请选择大数据组件中的“阿里云云数据库 ClickHouse”。 统计方式仅支持“全量校验”。 创建CloudTable(ClickHouse)统计任务并执行,方法请参考创建统计任务并执行校验。需要注意任务配置中的表组,选择步骤20
输入需要进行校验的DLI队列名称。队列类型必须是SQL队列。 采集资源使用信息 可选参数。开启后,通过该连接创建的统计任务将收集大数据服务的资源使用信息,这些信息将用于MgC上的报告生成,以便于进行性能优化。 须知: 使用该功能,需要MgC Agent添加的华为云账号AK/SK拥有MR
对于空文件夹,覆盖策略与文件相同。 CRC64对比覆盖 迁移前,对于源端和目的端存在的同名对象,对比源端和目的端对象元数据中的CRC64值,相同则跳过,不同则覆盖。如果源端与目的端对象元数据中不存在CRC64值,则默认使用大小/最后修改时间对比覆盖策略执行。 说明: 目前仅支持华为云、阿里云、腾讯云。 目的端OBS桶需开启CRC64特性白名单。
填写连接MetaStore的端口,默认为9083。 启用元数据仓连接 在增量数据校验中,如果通过Metastore查询,当分区数量超过30,000时,可能会因为将所有分区信息加载到内存中而导致内存溢出(OOM)。因此,使用MySQL作为元数据仓可以有效地解决这一问题。 不启用:系统通过MetaStore查询Hive表的分区信息。
子网的可用IP数≥迁移节点数+列举节点数+1。 模式选择 公网:使用公网迁移,并选择公网网关。如果没有可用网关,选择“新建网关”,选择网关规格和EIP(EIP最多支持同时勾选20个)。 内网:使用内网迁移,适用于同一区域内的迁移场景。 专线:使用专线迁移,通过专线直接访问源端数据。搭建云专线的方法可参考云专线
列表文件的元数据中不能设置“ContentEncoding”,否则会导致迁移失败。 列表文件中每行使用制表符(键盘上Tab键)\t分隔URL和目的端对象名称,请勿使用空格。格式为:[URL][制表符][目的端对象名称],其中源端对象名称如果包含中文、特殊字符必须使用URL Enco
主机迁移重要声明 了解迁移过程中的重要信息和免责声明,详情请参见主机迁移服务重要声明有哪些? 约束与限制 确保迁移过程符合服务条款和限制条件,详情请参见主机迁移约束与限制。 计费说明 了解迁移过程中可能产生的费用,详情请参见计费说明。 权限配置 使用IAM进行精细的权限管理,详情请参见权限配置。
迁移完成后,您需要手动清理该路径下生成的文件夹,以释放存储空间。 采集资源使用信息 可选参数。开启后,通过该连接创建的统计任务将收集大数据服务的资源使用信息,这些信息将用于MgC上的报告生成,以便于进行性能优化。 须知: 使用该功能,需要MgC Agent添加的华为云账号AK/SK拥有MR
93.xxx.xxx:7480/bucket01/index.html 根据上一步的方法和要求,将列表文件中的所有共享s3地址替换为URL地址。如果列表文件中的s3地址较多,可以使用文本编辑器(如NotePad++)进行批量替换。 根据MgC的要求,编辑URL列表文件内容,使其包含文件的共享下载链接和文件名,格式为:
Hive校验的sum统计结果显示未达标 问题描述 对Hive进行大数据校验,Hive中的double字段保存的值为 1.7976931348623157E308 和 -1.7976931348623157E308 时 sum 统计结果显示未达标。 问题分析 使用spark-sql 客户端,进行sql操作,出现用同一个命令存在返回值不同的情况。
文件存储批量迁移 本文介绍如何使用迁移中心(MgC)的迁移方案配置功能和文件存储批量迁移模板,以高效完成文件存储的批量迁移工作。 源端支持的类型:NAS_NFS_V3_MOUNT、NAS_NFS_V3_PROTOCOL、NAS_GFS。 目的端支持的类型:NAS_NFS_V3_MOUNT。
于Windows License可以使用华为云License服务器获取新License,应用License用户自行解决。 源端磁盘数据安全性声明 迁移过程中,迁移服务无法感知磁盘内容,需要您自行保障源端磁盘数据的安全性。如果因为源端磁盘数据中存在木马或病毒等软件,导致迁移后目的端
限去修改或删除旧脚本,这将导致新脚本无法上传,从而使校验步骤失败。 解决方法 使用sudo用户登录源端主机。 删除“/home/用户名/”目录下的“rda”文件夹。其中“用户名”是sudo用户登录时使用的用户名。 返回MgC控制台,重新运行主机迁移工作流。 父主题: 主机迁移工作流
部署MgC Agent(原Edge) 使用迁移中心的大数据相关功能前,需要先在可以访问源端数据来源的环境中部署MgC Agent。 MgC Agent不具备自动重启功能,严禁在任务执行期间重启MgC Agent,以避免任务失败。 准备工作 建议在源端内网环境中准备一台用于安装MgC Age
入门指引 本入门指引为您介绍如何使用迁移中心创建主机迁移工作流,以及前期需要做的准备工作,让您对迁移中心的功能和操作有个初步认识。 迁移中心目前还支持跨可用区迁移和存储迁移,创建迁移工作流的操作步骤请参考华为云主机跨可用区迁移、迁移其他云平台存储数据至华为云。 操作流程 操作步骤
子网的可用IP数≥迁移节点数+列举节点数+1。 模式选择 公网:使用公网迁移,并选择公网网关。如果没有可用网关,选择“新建网关”,选择网关规格和EIP(EIP最多支持同时勾选20个)。 内网:使用内网迁移,适用于同一区域内的迁移场景。 专线:使用专线迁移,通过专线直接访问源端数据。搭建云专线的方法可参考云专线