搜索_华为云

Hudi目的端的作业执行过程中，由于源端连接闪断、超时或主动终止连接导致作业执行失败怎么处理？ - 云数据迁移 CDM

Hudi目的端的作业执行过程中，由于源端连接闪断、超时或主动终止连接导致作业执行失败怎么处理？问题描述作业执行过程中，由于源端连接闪断、超时或者源端主动终止了连接导致作业执行失败。问题分析日志中出现源端的read timeout报错，或者terminate by xxx之类的报错。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
步骤3：创建并执行作业 - 云数据迁移 CDM

认值“否”。抽取并发数：设置同时执行的抽取任务数，适当的抽取并发数可以提升迁移效率，配置原则请参见性能调优。这里保持默认值“1”。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该参数配置，写入脏数据前需要在CD

帮助中心 > 云数据迁移 CDM > 快速入门
随机集群创建作业并执行 - 云数据迁移 CDM

execute_create_date 否 Long 最近一次执行任务创建时间，单位：毫秒。由系统生成，用户无需填写。 status 否 String 作业最后的执行状态： BOOTING：启动中。 RUNNING：运行中。 SUCCEEDED：成功。 FAILED：失败。 NEW：未被执行。表5 ConfigValues

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
查询作业执行历史 - 云数据迁移 CDM

Long 执行时间。 status String 作业状态： BOOTING：启动中。 FAILURE_ON_SUBMIT：提交失败。 RUNNING：运行中。 SUCCEEDED：成功。 FAILED：失败。 UNKNOWN：未知。 NEVER_EXECUTED：未被执行。 error-details

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
CDM迁移近一个月的数据 - 云数据迁移 CDM

40/36 Gbit/s 64 - 其他场景中，可根据情况选择多个CDM集群同时迁移，加快迁移效率。MRS HDFS多副本策略会占用网络带宽，影响迁移速率。华为云CDM创建连接创建2个CDM集群： DataArts Studio实例中已经包含一个CDM集群（试用版除外），如果该集群已

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
DES迁移一个月前的历史数据 - 云数据迁移 CDM

DES迁移一个月前的历史数据迁移流程通过脚本将一个月前的历史数据导入到DES盒子。DES盒子的相关操作请参见数据快递服务 DES。 DES将数据快递到华为云数据中心。使用华为云CDM将DES中的数据迁移到华为云OBS。使用华为云CDM将OBS数据迁移到MRS。其中CDM

帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
Hudi源端作业，读Hudi作业字段映射多了一列col，作业执行失败怎么处理？ - 云数据迁移 CDM

Hudi源端作业，读Hudi作业字段映射多了一列col，作业执行失败怎么处理？问题描述读Hudi作业字段映射多了一列col，作业执行失败。原因分析使用Spark SQL写数据入hudi表，由于配置问题，表schema中会自动增加一列类型为array<string>，名称为col的列。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

通过json方式导入的作业，sql server迁移到hive，执行作业报错问题描述客户通过json的方式导入作业，从sql server迁移数据到hive，执行作业报：操作数数据类型bit 对min 运算无效。图1 报错信息故障分析客户作业中配置的并发数大于1，CDM会选择分区列进行分区

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

“不存在时创建”重跑作业。或者删除后自己执行建表语句重建一个Hudi表。对于MOR表来说，删表需要把ro与rt表也同时删除。否则会出现schema残留的问题。删除空值后重跑作业。具体办法：在作业管理界面选择“更多-失败重试”，尝试重新执行Spark SQL。通过DataArts Studio执行Spark

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi目的端的作业执行卡Running，数据写入行数一直显示为0如何处理？ - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，数据写入行数一直显示为0如何处理？问题描述打开日志，最后一行日志如下所示，则说明此时集群并发资源消耗殆尽，或者集群内存使用达到阈值，新提交的作业需要排队等待。 submit task attempt_local1847334969_1748_m_000003_0

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi目的端的作业执行卡Running，读取行数写入行数相等且不再增加怎么解决？ - 云数据迁移 CDM

在执行Spark SQL过程中，需要等Spark SQL执行完作业才会结束。原因分析打开日志，搜索insert into，找到如下的日志，根据日志中打印的Yarn ApplicationId到MRS Resource Manager上看Yarn任务详情。执行Spark SQ

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
执行Postgresql-to-Hive迁移作业报错“Error occurs during loader run” - 云数据迁移 CDM

执行Postgresql-to-Hive迁移作业报错“Error occurs during loader run” 问题描述用户使用CDM服务，从源端pg迁移数据到目的端hive界面报错提示“Error occurs during loader run”。故障分析排查客户

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
获取集群列表为空/没有权限访问/操作时报当前策略不允许执行？ - 云数据迁移 CDM

获取集群列表为空/没有权限访问/操作时报当前策略不允许执行？问题描述在使用CDM时，可能遇到如下权限相关的问题：跳转到CDM首页，获取到的集群列表为空。提示没有权限访问，如图1所示。执行启动作业/重启集群等操作时，报错当前策略不允许执行，如图2所示。图1 没有权限访问图2 不允许创建连接

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Mysql导入数据到DLI，快执行完时失败了提示Invoke DLI service api failed错误怎么解决？ - 云数据迁移 CDM

Mysql导入数据到DLI，快执行完时失败了提示Invoke DLI service api failed错误怎么解决？问题描述导入了4000W数据，快执行完时报如下错误。故障分析结合报错，考虑是DLI目的端写入问题。但因日志截图不全，进入CDM集群，查看客户作业日志。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
MRS中恢复HBase表 - 云数据迁移 CDM

使用快照迁移并恢复会变的数据在源端CDH集群HBase shell中执行： flush <table name> 在源端CDH集群HBase shell执行： compact <table name> 如果表没有打开Snap功能，则执行： hadoop dfsadmin -allowSnapshot

帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
基本概念 - 云数据迁移 CDM
基本概念 - 云数据迁移 CDM

CDM集群是指用户拥有的CDM实例，一个CDM集群由1个或多个虚拟机组成。一个用户可以创建多个CDM集群，例如为财务部门和采购部门各创建一个CDM实例，实现数据访问权限的隔离。本地环境本地环境是指用户自建或者租用的IDC中的数据存储系统，或者第三方云环境中的数据存储系统，包括关系型数据库以及文件系统。

帮助中心 > 云数据迁移 CDM > 产品介绍
写ES报timeout waiting for connection from pool错误怎么解决？ - 云数据迁移 CDM

pool，且日志中输出多个es_rejected_execution_exception。故障分析从cerebro界面看到索引只有一个分片。但新建一个索引设成3个分片也是一样会报es_rejected_execution_exception。继续定位发现记录几乎都写入到了一个分片中。至此问题清楚。是因为产生了热点。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置Oracle源端参数 - 云数据迁移 CDM

如果选择界面没有待选择的表，请确认表是否已经创建，或者对应连接里的账号是否有元数据查询的权限。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
新建整库迁移作业 - 云数据迁移 CDM

任务参数各参数说明如表3所示。表3 任务配置参数参数说明取值样例同时执行的表个数抽取时并发执行的表的数量。 3 抽取并发数当前任务从源端进行读取最大线程数。说明：由于数据源限制，实际执行时并发的线程数可能小于等于此处配置的并发数，如CSS，ClickHouse数据源不支持多并发抽取。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
指定文件名迁移 - 云数据迁移 CDM

从FTP/SFTP/OBS导出文件时，CDM支持指定文件名迁移，用户可以单次迁移多个指定的文件（最多50个），导出的多个文件只能写到目的端的同一个目录。在创建表/文件迁移作业时，如果源端数据源为FTP/SFTP/OBS，CDM源端的作业参数“源目录或文件”支持输入多个文件名（最多50个），文件名之间默认使用“|”

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践

总条数： 297

上一页
1
2
3
4
5
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi目的端的作业执行过程中，由于源端连接闪断、超时或主动终止连接导致作业执行失败怎么处理？ - 云数据迁移 CDM

步骤3：创建并执行作业 - 云数据迁移 CDM

随机集群创建作业并执行 - 云数据迁移 CDM

查询作业执行历史 - 云数据迁移 CDM

CDM迁移近一个月的数据 - 云数据迁移 CDM

DES迁移一个月前的历史数据 - 云数据迁移 CDM

Hudi源端作业，读Hudi作业字段映射多了一列col，作业执行失败怎么处理？ - 云数据迁移 CDM

通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，数据写入行数一直显示为0如何处理？ - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，读取行数写入行数相等且不再增加怎么解决？ - 云数据迁移 CDM

执行Postgresql-to-Hive迁移作业报错“Error occurs during loader run” - 云数据迁移 CDM

获取集群列表为空/没有权限访问/操作时报当前策略不允许执行？ - 云数据迁移 CDM

Mysql导入数据到DLI，快执行完时失败了提示Invoke DLI service api failed错误怎么解决？ - 云数据迁移 CDM

MRS中恢复HBase表 - 云数据迁移 CDM

基本概念 - 云数据迁移 CDM

写ES报timeout waiting for connection from pool错误怎么解决？ - 云数据迁移 CDM

配置Oracle源端参数 - 云数据迁移 CDM

新建整库迁移作业 - 云数据迁移 CDM

指定文件名迁移 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线