数据治理中心 DATAARTS STUDIO-调度作业:配置节点调度任务(实时作业)
配置节点调度任务(实时作业)
配置实时处理作业的节点调度任务,支持单次调度、周期调度、事件驱动调度三种方式。操作方法如下:
单击画布中的节点,在右侧显示“调度配置”页签,单击此页签,展开配置页面,配置如表4所示的参数。
参数 |
说明 |
---|---|
调度方式 |
选择作业的调度方式:
|
“周期调度”的参数 |
|
生效时间 |
调度任务的生效时间段。 |
调度周期 |
选择调度任务的执行周期,并配置相关参数:
调度周期需要合理设置,如 CDM 、ETL作业的调度周期至少应在5分钟以上,并根据作业表的数据量、源端表更新频次等调整。 已经在运行中的作业,可以修改其调度周期。 |
跨周期依赖 |
选择作业下实例之间的依赖关系。 |
“事件驱动调度”的参数 |
|
触发事件类型 |
选择触发作业运行的事件类型。 |
DIS通道名称 |
选择DIS通道,当指定的DIS通道有新消息时,数据开发模块将新消息传递给作业,触发该作业运行。 当“触发事件类型”选择“DIS”或“OBS”时才需要配置。 |
连接名称 |
选择数据连接,需先在“管理中心”创建kafka数据连接。当“触发事件类型”选择“KAFKA”时才需要配置。 |
Topic |
选择需要发往kafka的消息Topic。当“触发事件类型”选择“KAFKA”时才需要配置。 |
OBS路径 |
选择要监听的OBS路径,如果该路径下有新增文件,则触发调度;新增的文件的路径名,可以通过变量Job.trigger.obsNewFiles引用。前提条件:该OBS路径已经配置DIS 消息通知 。 |
最大处理文件数 |
节点被驱动运行时,每批次最多可处理的文件数。当“触发事件类型”选择“OBS”时才需要配置。 |
消费组 |
消费者组是kafka提供的可扩展且具有容错性的消费者机制。 它是一个组,所以内部可以有多个消费者,这些消费者共用一个ID,一个组内的所有消费者共同协作,完成对订阅的主题的所有分区进行消费。其中一个主题中的一个分区只能由一个消费者消费。
说明:
当触发事件类型选择了DIS或KAFKA时,会自动关联出消费组的ID,用户也可以手动修改。 |
事件处理并发数 |
选择作业并行处理的数量,最大并发数为10。 |
事件检测间隔 |
配置时间间隔,检测DIS通道下是否有新的消息。时间间隔单位可以配置为秒或分钟。 |
读取策略 |
|
失败策略 |
选择节点执行失败后的策略:
|