搜索_华为云

性能调优 - 云数据迁移 CDM
性能调优 - 云数据迁移 CDM

避免资源紧张导致迁移时间过长。调整抽取并发数对于低任务量场景，调整抽取并发数是性能调优的最佳方式。CDM迁移作业支持设置作业抽取并发数，同时也可以设置集群最大抽取并发数。 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行

 帮助中心 > 云数据迁移 CDM > 性能白皮书
支持的数据源（2.10.0.300） - 云数据迁移 CDM

支持的数据源（2.10.0.300）数据集成有两种迁移方式，支持的数据源有所不同：表/文件迁移：适用于数据入湖和数据上云场景下，表或文件级别的数据迁移，请参见表/文件迁移支持的数据源类型。整库迁移：适用于数据入湖和数据上云场景下，离线或自建数据库整体迁移场景，请参见整库迁移支持的数据源类型。

帮助中心 > 云数据迁移 CDM > 产品介绍 > 支持的数据源
通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

的是从元数据里面的第一个字段作为分区字段。由于客户作业中设置的并发数是8，程序选择IsDef作为分区字段，但是IsDef的类型是bit，不支持min运算所以会报错。解决方案通过修改作业json的方式将作业并发数设置为1即可，参数："throttlingConfig.numExtractors"。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
支持的数据源（2.10.0.300） - 云数据迁移 CDM

支持的数据源（2.10.0.300）数据集成有两种迁移方式，支持的数据源有所不同：表/文件迁移：适用于数据入湖和数据上云场景下，表或文件级别的数据迁移，请参见表/文件迁移支持的数据源类型。整库迁移：适用于数据入湖和数据上云场景下，离线或自建数据库整体迁移场景，请参见整库迁移支持的数据源类型。

帮助中心 > 云数据迁移 CDM > 用户指南 > 支持的数据源
管理并查看CDM监控指标 - 云数据迁移 CDM

管理并查看CDM监控指标 CDM支持的监控指标设置CDM告警规则查看CDM监控指标父主题：创建并管理CDM集群

 帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
配置DLI目的端参数 - 云数据迁移 CDM

car_detail 导入前清空数据选择导入前是否清空目的表的数据。如果设置为是，任务启动前会清除目标表中数据。否空字符串作为null 如果设置为true，空字符串将作为null。否清空数据方式导入前清空数据，如果设置为true时，呈现此参数。 TRUNCATE：删除标准数据。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。如何调整抽取并发数集群最大抽取并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议规格名称 vCPUs/内存集群并发数上限参考

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
CDM迁移数据到DWS时如何选取分布列？ - 云数据迁移 CDM

FusionInsight LibrA过程中，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。因此，在单表或整库导入到DWS/FusionInsight

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
目的端为关系数据库 - 云数据迁移 CDM

先导入阶段表，如果设置为“true”，数据导入目的表之前会把数据先导入阶段表，如果成功导入阶段表，则再从阶段表导入到目的表，这样避免导入过程失败，在目的表遗留部分成功数据。 toJobConfig.extendCharLength 否 Boolean 扩大字符字段长度，如果设置为“tru

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为HTTP/HTTPS - 云数据迁移 CDM

个文件，默认为|。 fromJobConfig.useQuery 否 Boolean 该参数设置为“true”时，上传到OBS的对象使用的对象名，为去掉query参数后的字符。该参数设置为“false”时，上传到OBS的对象使用的对象名，包含query参数。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
配置DIS源端参数 - 云数据迁移 CDM

DIS的通道名。 dis 是否持久运行用户自定义是否永久运行。设置为长久运行的任务，如果DIS系统发生中断，任务也会失败结束。是 DIS分区ID DIS分区ID，该参数支持输入多个分区ID，使用英文逗号（,）分隔。 0,1,2 偏移量参数设置从DIS拉取数据时的初始偏移量：最新：最大偏移量，即拉取最新的数据。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
CloudTable连接参数说明 - 云数据迁移 CDM

cloudtable.com:2181 IAM统一身份认证如果所需连接的CloudTable集群在创建时开启了“IAM统一身份认证”，该参数需设置为“是”，否则设置为“否”。当选择IAM统一身份认证时，需要输入用户名、AK和SK。否用户名登录CloudTable集群的用户名。 admin

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
新建Hadoop集群配置 - 云数据迁移 CDM

获取下载的tar包，此即为FusionInsight集群Keytab文件。针对MRS 2.x及之前版本集群：登录MRS服务的Manager，单击“系统设置”。在“权限配置”区域，单击“用户管理”。在需导出keytab文件用户所在的行，选择“更多 > 下载认证凭据”下载认证文件，待文件自动生成后指定保存位置，并妥善保管该文件。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接
步骤3：创建并执行作业 - 云数据迁移 CDM

样，所需的长度也不一样，一个中文字符在UTF-8编码下可能要占3个字节。该参数选择为“是”后，在DWS中自动创表时，会将字符类型的字段长度设置为原表的3倍，避免出现DWS表的字符字段长度不够的报错。其他可选参数保持默认即可，详细说明可参见配置DWS目的端参数。单击“下一步”进

 帮助中心 > 云数据迁移 CDM > 快速入门
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

metastore中存在，但是表目录不存在，根因是在表目录下没有.hoodie目录。可能删表的时候只删了文件而没有drop table。设置为主键或者预聚合键的列有空值，写入hoodie会失败。查看作业配置，查看表属性中hoodie.datasource.write.recordkey

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置HTTP源端参数 - 云数据迁移 CDM

隔符来区分各个文件，默认为|。列表文件选择“是”时，不显示该参数。 | QUERY参数该参数设置为“是”时，上传到OBS的对象使用的对象名，为去掉query参数后的字符。该参数设置为“否”时，上传到OBS的对象使用的对象名，包含query参数。否忽略不存在原路径/文件如

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
新建整库迁移作业 - 云数据迁移 CDM

、清洗规则。 /user/dirtydir 单个分片的最大错误记录数当“是否写入脏数据”为“是”才显示该参数。单个map的错误记录超过设置的最大错误记录数则任务自动结束，已经导入的数据不支持回退。推荐使用临时表作为导入的目标表，待导入成功后再改名或合并到最终数据表。 0 单击“保存”，或者“保存并运行”。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
查询集群列表 - 云数据迁移 CDM

查询集群列表功能介绍查询集群列表接口。调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/clusters 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
配置Elasticsearch/云搜索服务源端参数 - 云数据迁移 CDM

Elasticsearch分页查询，用来设置分页size的大小。 1000 ScrollId超时时间配置 Elasticsearch scroll查询时会记录一个scroll_id，超时或者scroll查询结束后会清除请求的srcoll_id，通过设置这个超时时间配置，来指定scroll_id超时时间。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
功能类 - 云数据迁移 CDM
功能类 - 云数据迁移 CDM

API创建数据迁移作业？如何将云下内网或第三方云上的私网与CDM连通？ CDM是否支持参数或者变量？ CDM迁移作业的抽取并发数应该如何设置？ CDM是否支持动态数据实时迁移功能？ CDM是否支持集群关机功能？如何使用表达式方式获取当前时间？在创建迁移作业时，where语句参数中的时间格式是怎样的？

帮助中心 > 云数据迁移 CDM > 常见问题

总条数： 124

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

性能调优 - 云数据迁移 CDM

支持的数据源（2.10.0.300） - 云数据迁移 CDM

通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

支持的数据源（2.10.0.300） - 云数据迁移 CDM

管理并查看CDM监控指标 - 云数据迁移 CDM

配置DLI目的端参数 - 云数据迁移 CDM

CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

CDM迁移数据到DWS时如何选取分布列？ - 云数据迁移 CDM

目的端为关系数据库 - 云数据迁移 CDM

源端为HTTP/HTTPS - 云数据迁移 CDM

配置DIS源端参数 - 云数据迁移 CDM

CloudTable连接参数说明 - 云数据迁移 CDM

新建Hadoop集群配置 - 云数据迁移 CDM

步骤3：创建并执行作业 - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

配置HTTP源端参数 - 云数据迁移 CDM

新建整库迁移作业 - 云数据迁移 CDM

查询集群列表 - 云数据迁移 CDM

配置Elasticsearch/云搜索服务源端参数 - 云数据迁移 CDM

功能类 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线