MAPREDUCE服务 MRS-structured streaming功能与可靠性介绍:Structured Streaming支持的功能

时间:2024-10-18 17:22:33

Structured Streaming支持的功能

  1. 支持对流式数据的ETL操作。
  2. 支持流式DataFrames或Datasets的schema推断和分区。
  3. 流式DataFrames或Datasets上的操作:包括无类型,类似SQL的操作(比如select、where、groupBy),以及有类型的RDD操作(比如map、filter、flatMap)。
  4. 支持基于Event Time的聚合计算,支持对迟到数据的处理。
  5. 支持对流式数据的去除重复数据操作。
  6. 支持状态计算。
  7. 支持对流处理任务的监控。
  8. 支持批流join,流流join。

    当前JOIN操作支持列表如下:

    左表

    右表

    支持的Join类型

    说明

    Static

    Static

    全部类型

    即使在流处理中,不涉及流数据的join操作也能全部支持

    Stream

    Static

    Inner

    支持,但是无状态

    Left Outer

    支持,但是无状态

    Right Outer

    不支持

    Full Outer

    不支持

    Stream

    Stream

    Inner

    支持,左右表可选择使用watermark或者时间范围进行状态清理

    Left Outer

    有条件的支持,左表可选择使用watermark进行状态清理,右表必须使用watermark+时间范围

    Right Outer

    有条件的支持,右表可选择使用watermark进行状态清理,左表必须使用watermark+时间范围

    Full Outer

    不支持

support.huaweicloud.com/devg3-mrs/mrs_07_200144.html