数据治理中心 DATAARTS STUDIO-调度作业:配置节点调度任务(实时作业)

时间:2024-12-04 08:59:40

配置节点调度任务(实时作业)

配置实时处理作业的节点调度任务,支持单次调度、周期调度、事件驱动调度三种方式。操作方法如下:

单击画布中的节点,在右侧显示“调度配置”页签,单击此页签,展开配置页面,配置如表4所示的参数。

表4 节点调度配置

参数

说明

调度方式

选择作业的调度方式:

  • 单次调度:手动触发作业单次运行。
  • 周期调度:周期性自动运行作业
  • 事件驱动调度:根据外部条件触发作业运行。

“周期调度”的参数

生效时间

调度任务的生效时间段。

调度周期

选择调度任务的执行周期,并配置相关参数:

  • 分钟
  • 小时

调度周期需要合理设置,如 CDM 、ETL作业的调度周期至少应在5分钟以上,并根据作业表的数据量、源端表更新频次等调整。

已经在运行中的作业,可以修改其调度周期。

跨周期依赖

选择作业下实例之间的依赖关系。

  • 不依赖上一调度周期

    选择“并发数”。多个作业实例并行执行的个数。如果并发数配置为1,前一个批次执行完成后(包括成功、取消、或失败),下一批次才开始执行。

  • 自依赖(上一调度周期的作业实例执行成功下一周期才会执行,否则处于等待运行状态。)

“事件驱动调度”的参数

触发事件类型

选择触发作业运行的事件类型。

DIS通道名称

选择DIS通道,当指定的DIS通道有新消息时,数据开发模块将新消息传递给作业,触发该作业运行。

当“触发事件类型”选择“DIS”或“OBS”时才需要配置。

连接名称

选择数据连接,需先在“管理中心”创建kafka数据连接。当“触发事件类型”选择“KAFKA”时才需要配置。

Topic

选择需要发往kafka的消息Topic。当“触发事件类型”选择“KAFKA”时才需要配置。

OBS路径

选择要监听的OBS路径,如果该路径下有新增文件,则触发调度;新增的文件的路径名,可以通过变量Job.trigger.obsNewFiles引用。前提条件:该OBS路径已经配置DIS 消息通知

最大处理文件数

节点被驱动运行时,每批次最多可处理的文件数。当“触发事件类型”选择“OBS”时才需要配置。

消费组

消费者组是kafka提供的可扩展且具有容错性的消费者机制。

它是一个组,所以内部可以有多个消费者,这些消费者共用一个ID,一个组内的所有消费者共同协作,完成对订阅的主题的所有分区进行消费。其中一个主题中的一个分区只能由一个消费者消费。

说明:
  1. 一个消费者组可以有多个消费者。
  2. Group ID是一个字符串,在一个kafka集群中,它标识唯一的一个消费者组。
  3. 每个消费者组订阅的所有主题中,每个主题的每个分区只能由一个消费者消费。消费者组之间不影响。

当触发事件类型选择了DIS或KAFKA时,会自动关联出消费组的ID,用户也可以手动修改。

事件处理并发数

选择作业并行处理的数量,最大并发数为10。

事件检测间隔

配置时间间隔,检测DIS通道下是否有新的消息。时间间隔单位可以配置为秒或分钟。

读取策略

  • 从上次位置读起
  • 从最新位置读起

    当“触发事件类型”选择“DIS”或“KAFKA”时才需要配置。

失败策略

选择节点执行失败后的策略:

  • 挂起
  • 忽略失败,继续调度
support.huaweicloud.com/usermanual-dataartsstudio/dataartsstudio_01_0470.html