云数据迁移 CDM-作业任务参数说明:参数说明

时间:2023-11-01 16:16:29

参数说明

参数

是否必选

类型

说明

throttlingConfig.numExtractors

Integer

最大抽取任务并发数,例如:“20”

groupJobConfig.groupName

枚举

选择作业所属的分组,默认分组为“DEFAULT”

throttlingConfig.numLoaders

Integer

仅当HBase或Hive作为目的数据源时该参数才有效。

最大加载任务数,例如:“5”

throttlingConfig.recordDirtyData

Boolean

是否写入脏数据,例如:“true”

throttlingConfig.writeToLink

String

脏数据要写入的连接,目前只支持写入到OBS连接或HDFS连接。例如:“obslink”

throttlingConfig.obsBucket

String

写入脏数据的OBS桶的名称,只有当脏数据要写入OBS连接的时候,此参数才生效。例如:“dirtyData”

throttlingConfig.dirtyDataDirectory

String

写入脏数据的目录:

  • 如果选择写入到HDFS,此参数即为HDFS目录。
  • 如果选择写入到OBS,此参数表示相应的OBS桶下的目录,例如:“/data/dirtydata/”

throttlingConfig.maxErrorRecords

String

单个分片的最大错误记录数。单个map的错误记录超过设置的最大错误记录数时,任务自动结束,已经导入的数据不回退。

schedulerConfig.isSchedulerJob

Boolean

是否开启定时任务,例如:“true”

schedulerConfig.cycleType

String

定时任务的周期类型,目前支持五种周期类型:

  • minute:分钟
  • hour:小时
  • day:天
  • week:周
  • month:月

schedulerConfig.cycle

Integer

定时任务的周期,如果周期类型选择了“minute”“cycle”输入“10”,就表示该定时任务每10分钟执行一次。

schedulerConfig.runAt

String

定时任务在周期内的触发时间,当周期为“hour”“week”“month”时,该参数有效。

  • 如果周期类型为“month”,设定周期为“1”“runAt”输入“15”,就表示每个月的15号执行该定时任务。并且该参数支持输入多个,以英文的逗号“,”分隔开。

    例如上述场景中“runAt”输入“1,2,3,4,5”,就表示每个月的1日、2日、3日、4日和5日执行该定时任务。

  • 周期类型为“week”时,“runAt”输入“mon,tue,wed,thu,fri”,就表示周一到周五执行该定时任务。
  • 周期类型为“hour”时,“runAt”输入“27,57”,表示周期内的的27分和57分执行该定时任务。

schedulerConfig.startDate

String

定时任务的开始时间,例如:“2018-01-24 19:56:19”

schedulerConfig.stopDate

String

定时任务的结束日期,例如:“2018-01-27 23:59:00”

如果不输入结束时间,则表示定时任务将一直执行,永远不会结束。

schedulerConfig.disposableType

枚举

作业运行完是否删除:
  • NONE:作业执行完不删除。
  • DELETE_AFTER_SUCCEED:仅作业执行成功时删除该作业,适合海量一次性作业。
  • DELETE:作业执行完删除该作业,执行成功或失败都会删除。

retryJobConfig.retryJobType

枚举

如果作业执行失败,选择是否自动重试:

  • NONE:不重试。
  • RETRY_TRIPLE:重试三次。
support.huaweicloud.com/api-cdm/cdm_02_0059.html