搜索_华为云

当Hudi表属性和hoodie.properties文件中分区信息不一致时，会导致数据写入失败怎么解决？ - 云数据迁移 CDM

properties文件中分区信息不一致时，会导致数据写入失败怎么解决？问题描述当Hudi表属性和hoodie.properties文件中分区信息不一致时，会导致数据写入失败。解决方案执行如下spark-sql语句修改hoodie.properties文件信息。 call

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置HDFS源端参数 - 云数据迁移 CDM

Parquet格式：以Parquet格式解析源文件，用于HDFS数据导到表的场景。 CSV格式列表文件当“文件格式”选择为“二进制格式”时，才有该参数。打开列表文件功能时，支持读取OBS桶中文件（如txt文件）的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径（不支持目录），文件内容示例如下：

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
步骤4：查看作业运行结果 - 云数据迁移 CDM

步骤4：查看作业运行结果操作场景作业完成后，可以查看作业执行结果及最近30天内的历史信息，包括写入行数、读取行数、写入字节、写入文件数和日志等信息。操作步骤在集群管理界面，找到步骤1：创建集群章节创建的集群“cdm-aff1”。单击该CDM集群后的“作业管理”，进入作业管理界面。

帮助中心 > 云数据迁移 CDM > 快速入门
源端为对象存储 - 云数据迁移 CDM

CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
配置HDFS目的端参数 - 云数据迁移 CDM

/user/output 文件格式写入后的文件格式，可选择以下文件格式： CSV格式：按CSV格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/S

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
MRS Hudi连接参数说明 - 云数据迁移 CDM

新增访问密钥”，如图1所示。图1 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
支持的数据源（2.9.2.200） - 云数据迁移 CDM

200版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 云数据迁移 CDM > 产品介绍 > 支持的数据源
支持的数据源（2.9.2.200） - 云数据迁移 CDM

200版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 云数据迁移 CDM > 用户指南 > 支持的数据源
支持的数据源（2.10.0.300） - 云数据迁移 CDM

300版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 云数据迁移 CDM > 用户指南 > 支持的数据源
支持的数据源（2.9.3.300） - 云数据迁移 CDM

300版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 云数据迁移 CDM > 用户指南 > 支持的数据源
MRS HDFS数据迁移到OBS - 云数据迁移 CDM

源连接名称：选择创建MRS HDFS连接中的“hdfs_llink”。源目录或文件：待迁移数据的目录或单个文件路径。文件格式：传输数据时所用的文件格式，这里选择“二进制格式”。不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。其他可选参数一般情况下保持默认即可。目的端作业配置

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 使用教程
MRS HDFS数据迁移到OBS - 云数据迁移 CDM

源连接名称：选择创建MRS HDFS连接中的“hdfs_llink”。源目录或文件：待迁移数据的目录或单个文件路径。文件格式：传输数据时所用的文件格式，这里选择“二进制格式”。不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。其他可选参数一般情况下保持默认即可。目的端作业配置

 帮助中心 > 云数据迁移 CDM > 用户指南 > 使用教程
支持的数据源（2.9.3.300） - 云数据迁移 CDM

300版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 云数据迁移 CDM > 产品介绍 > 支持的数据源
支持的数据源（2.10.0.300） - 云数据迁移 CDM

300版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 云数据迁移 CDM > 产品介绍 > 支持的数据源
目的端为OBS - 云数据迁移 CDM
目的端为OBS - 云数据迁移 CDM

源端为数据库时该参数有效，支持按大小分成多个文件存储，避免导出的文件过大，单位为MB。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式： REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
配置Hive源端参数 - 云数据迁移 CDM

CDM作业实际启动时间-偏移量”。 TBL_E 读取方式包括HDFS和JDBC两种读取方式。默认为HDFS方式，如果没有使用WHERE条件进行数据过滤及在字段映射页面添加新字段的需求，选择HDFS方式即可。 HDFS文件方式读取数据时，性能较好，但不支持使用WHERE条件进行数据过滤及在字段映射页面添加新字段。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
是否支持批量创建作业？ - 云数据迁移 CDM

CDM可以通过批量导入的功能，实现批量创建作业，方法如下：手动创建一个作业。导出作业，将作业的JSON文件保存到本地。编辑JSON文件，参考该作业的配置，在JSON文件中批量复制出更多作业。将JSON文件导入CDM集群，实现批量创建作业。您也可以参考通过CDM算子批量创建分表迁移作业，配合For

帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
正则表达式分隔半结构化文本 - 云数据迁移 CDM

在创建表/文件迁移作业时，对简单CSV格式的文件，CDM可以使用字段分隔符进行字段分隔。但是对于一些复杂的半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
时间宏变量使用解析 - 云数据迁移 CDM

时间宏变量使用解析在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
时间宏变量使用解析 - 云数据迁移 CDM

时间宏变量使用解析在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导

总条数： 196

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

当Hudi表属性和hoodie.properties文件中分区信息不一致时，会导致数据写入失败怎么解决？ - 云数据迁移 CDM

配置HDFS源端参数 - 云数据迁移 CDM

步骤4：查看作业运行结果 - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

配置HDFS目的端参数 - 云数据迁移 CDM

MRS Hudi连接参数说明 - 云数据迁移 CDM

支持的数据源（2.9.2.200） - 云数据迁移 CDM

支持的数据源（2.9.2.200） - 云数据迁移 CDM

支持的数据源（2.10.0.300） - 云数据迁移 CDM

支持的数据源（2.9.3.300） - 云数据迁移 CDM

MRS HDFS数据迁移到OBS - 云数据迁移 CDM

MRS HDFS数据迁移到OBS - 云数据迁移 CDM

支持的数据源（2.9.3.300） - 云数据迁移 CDM

支持的数据源（2.10.0.300） - 云数据迁移 CDM

目的端为OBS - 云数据迁移 CDM

配置Hive源端参数 - 云数据迁移 CDM

是否支持批量创建作业？ - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

时间宏变量使用解析 - 云数据迁移 CDM

时间宏变量使用解析 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线