搜索_华为云

作业配置添加字段，MongoDB字段映射存在问题 - 云数据迁移 CDM

key。CDM支持combine()函数，可以把非公共的列封装为一个列。解决方案使用MongoDB Reader插件读出数据时，combine()支持合并MongoDB document中的多个字段为一个JSON串（多个字段合并成一个json串，当做一个字段到目的端）。目的端数据库把同步过去数据，通过SQL分解处理。如下图。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置Hive目的端参数 - 云数据迁移 CDM

取值范围是1-128，默认为空，不做限制，单位为MB，超出范围会设置为不限制。 16 源端Hive包含array和map类型时，目的端表格式只支持ORC和parquet复杂类型。若目的端表格式为RC和TEXT时，会对源数据进行处理，支持成功写入。因map类型为无序的数据结构，迁移到目的端的数据类型可能跟源端顺序不一致。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
基本概念 - 云数据迁移 CDM
基本概念 - 云数据迁移 CDM

由账号在IAM中创建的用户，是云服务的使用人员，具有身份凭证（密码和访问密钥）。在我的凭证下，您可以查看账号ID和用户ID。通常在调用API的鉴权过程中，您需要用到账号、用户和密码等信息。项目区域默认对应一个项目，这个项目由系统预置，用来隔离物理区域间的资源（计算资源、存储资源和网络资源），以默认项目为单位进

 帮助中心 > 云数据迁移 CDM > API参考 > 使用前必读
Kafka连接参数说明 - 云数据迁移 CDM

需要配置MRS Manager的用户名和密码。如果要创建MRS安全集群的数据连接，不能使用admin用户。因为admin用户是默认的管理页面用户，这个用户无法作为安全集群的认证用户来使用。您可以创建一个新的MRS用户，然后在创建MRS数据连接时，“用户名”和“密码”填写为新建的MRS用户及其密码。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
HBase连接 - 云数据迁移 CDM
HBase连接 - 云数据迁移 CDM

选择STANDALONE模式时，CDM支持在多个MRS集群的HDFS之间迁移数据。若在一个CDM中同时连接两个及以上开启Kerberos认证且realm相同的集群，只能使用EMBEDDED运行模式连接其中一个集群，其余需使用STANDALONE。 linkConfig.properties

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
车联网大数据零丢失搬迁入湖 - 云数据迁移 CDM

车联网大数据零丢失搬迁入湖车联网大数搬迁入湖简介场景介绍迁移准备 CDM迁移近一个月的数据 DES迁移一个月前的历史数据 MRS中恢复HBase表

 帮助中心 > 云数据迁移 CDM > 最佳实践
时间宏变量使用解析 - 云数据迁移 CDM

时间宏变量使用解析在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持通过宏

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
时间宏变量使用解析 - 云数据迁移 CDM

时间宏变量使用解析在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持通过宏

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
Hive连接参数说明 - 云数据迁移 CDM

Manager的用户名和密码。从HDFS导出目录时，如果需要创建快照，这里配置的用户需要HDFS系统的管理员权限。如果要创建MRS安全集群的数据连接，不能使用admin用户。因为admin用户是默认的管理页面用户，这个用户无法作为安全集群的认证用户来使用。您可以创建一个新的MRS用户，

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
目的端为OBS - 云数据迁移 CDM
目的端为OBS - 云数据迁移 CDM

据库的表迁移到文件系统的场景。选择“是”时，如果源端数据表中的某一个字段内容包含字段分隔符或换行符，写入目的端时CDM会使用双引号（"）作为包围符将该字段内容括起来，作为一个整体存储，避免其中的字段分隔符误将一个字段分隔成两个，或者换行符误将字段换行。例如：数据库中某字段为hello

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
配置分库源端参数 - 云数据迁移 CDM

如果选择界面没有待选择的表，请确认表是否已经创建，或者对应连接里的账号是否有元数据查询的权限。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。该参数支持配置正则表达式，实现导出满足规则的所有数据库。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
认证鉴权 - 云数据迁移 CDM
认证鉴权 - 云数据迁移 CDM

才能通过认证鉴权，从而使用API、SDK等方式访问DataArts Studio。 Token认证 Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存起来，避免频繁调用。使用Token前请确保Token离过期有足够的时间，防止调用API的过程中Token过期导致调用API失败。

帮助中心 > 云数据迁移 CDM > API参考 > 如何调用API
分库连接参数说明 - 云数据迁移 CDM

\”转义。例如“192.168.3.0:3306:cdm|192.168.2.2:3306:cdm:user:password”表示，第一个后端数据库IP为192.168.3.0，端口为3306，数据库名称为cdm，账户名密码以“用户名”、“密码”处配置为准；第二个后端数据库IP为192

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
配置FTP/SFTP源端参数 - 云数据迁移 CDM

迁移。待迁移数据的目录，将迁移目录下的所有文件（包括所有嵌套子目录及其子文件）。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
查询集群列表 - 云数据迁移 CDM

REBOOT_FAILURE：重启失败。 type String 节点类型，只支持一种类型“cdm”。 id String 节点的虚拟机ID。 name String 节点的虚拟机名称。 isFrozen String 节点是否冻结：0：否。1：是。 components String 组件。 config_status

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
配置MongoDB目的端参数 - 云数据迁移 CDM

执行任务前需要先执行的MongoDB查询语句。说明： “导入前准备语句”格式是json，只有两个键值对，第一个键值对是配置操作类别，key是"type"，value只支持"remove"和"drop"。第二个键值对是针对不同操作类别，需要配置的数据条件或者集合名称。导入前准备语句的执行不会影响即将写入的数据内容。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置MRS Hudi目的端参数 - 云数据迁移 CDM

入数据库选择界面。 dbadmin 表名单击输入框后面的按钮可进入表的选择界面。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
CDM作业配置管理 - 云数据迁移 CDM

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度，您可参考下文有效配置抽取并发数。集群最大抽取并发数的上限建议为vCPU核数*2，如表1所示。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
源端为HDFS - 云数据迁移 CDM
源端为HDFS - 云数据迁移 CDM

在并发任务数中指定“throttlingConfig.numExtractors”（抽取并发数）为“2”，则会分两个分片，一个处理9个10M的文件，一个处理1个200M的文件。 fromJobConfig.useMarkerFile 否 Boolean 选择是否开启作业标识文件

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
配置MRS Hudi源端参数 - 云数据迁移 CDM

default 表名输入或选择Hudi表名。单击输入框后面的按钮可进入表的选择界面。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数

总条数： 230

上一页
1
...
7
8
9
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

作业配置添加字段，MongoDB字段映射存在问题 - 云数据迁移 CDM

配置Hive目的端参数 - 云数据迁移 CDM

基本概念 - 云数据迁移 CDM

Kafka连接参数说明 - 云数据迁移 CDM

HBase连接 - 云数据迁移 CDM

车联网大数据零丢失搬迁入湖 - 云数据迁移 CDM

时间宏变量使用解析 - 云数据迁移 CDM

时间宏变量使用解析 - 云数据迁移 CDM

Hive连接参数说明 - 云数据迁移 CDM

目的端为OBS - 云数据迁移 CDM

配置分库源端参数 - 云数据迁移 CDM

认证鉴权 - 云数据迁移 CDM

分库连接参数说明 - 云数据迁移 CDM

配置FTP/SFTP源端参数 - 云数据迁移 CDM

查询集群列表 - 云数据迁移 CDM

配置MongoDB目的端参数 - 云数据迁移 CDM

配置MRS Hudi目的端参数 - 云数据迁移 CDM

CDM作业配置管理 - 云数据迁移 CDM

源端为HDFS - 云数据迁移 CDM

配置MRS Hudi源端参数 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线