检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
只能用在key-value对上,然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey(): Map[K, Long] 对每个key出现的次数做统计。 foreach(func: (T) => Unit): Unit 在数据集的每一个元素上,运行函数func。 countByValue()(implicit
commits.retained设置的阈值。如果是Flink写hudi,则至少提交的checkpoint要超过这个阈值;如果是批写Hudi,则批写次数要超过这个阈值。 建议 MOR表下游采用批量读模式,采用clean的版本数为compaction版本数+1。 MOR表一定要保证Compaction
只能用在key-value对上,然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey(): Map[K, Long] 对每个key出现的次数做统计。 foreach(func: (T) => Unit): Unit 在数据集的每一个元素上,运行函数func。 countByValue()(implicit
countByKey() 对每个key出现的次数做统计。 void foreach(VoidFunction<T> f) 在数据集的每一个元素上,运行函数func。 java.util.Map<T,Long> countByValue() 对RDD中每个元素出现的次数进行统计。 表3 Spark
只能用在key-value对上,然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey(): Map[K, Long] 对每个key出现的次数做统计。 foreach(func: (T) => Unit): Unit 在数据集的每一个元素上,运行函数func。 countByValue()(implicit
zkclient.ZkEventThread.run(ZkEventThread.java:71) 通过异常信息,发现当前Consumer没有在指定的重试次数内完成Rebalance,使得Consumer没有被分配Kafka Topic-Partition,则无法消费消息。 解决方法参考3。 查
Sink表时可选配置参数 参数名称 参数默认值 是否必须配置 参数描述 doris.request.retries 3 否 向Doris发送请求的重试次数。 doris.request.connect.timeout.ms 30000 否 向Doris发送请求的连接超时时间。 doris.request
Hive尝试连接ZooKeeper的超时时间。 hive.zookeeper.connection.max.retries Hive尝试连接ZooKeeper的最大重试次数。 ZooKeeper clientPort ZooKeeper的客户端端口。 ssl.enabled ZooKeeper的SSL连接开关。
transactionCapacity 1000 每次存取的最大Event数。 channelfullcount 10 Channel full次数,达到该次数后发送告警。 File Channel File Channel使用本地磁盘作为缓存区,Events存放在设置的“dataDirs”配置项文件夹中。常用配置如表7所示:
际场景配置的参数,请参见快速配置参数。 配置Stage失败重试次数 Spark任务在遇到FetchFailedException时会触发Stage重试。为了防止Stage无限重试,对Stage重试次数进行限制。重试次数可以根据实际需要进行调整。 在Spark客户端的“spark-defaults
proxy.healthcheck.recheckTimes 多租户模式下,JDBCServer代理检查JDBCServer健康状态失败后重试次数。 3 spark.thriftserver.proxy.healthcheck.waitTime 多租户模式下,JDBCServer代理
仅在启用bloomIndexBucketizedChecking并且索引类型为bloom的情况下适用。 此配置控制“存储桶”的大小,该大小可跟踪对单个文件进行的记录键检查的次数,并且是分配给执行布隆过滤器查找的每个分区的工作单位。 较高的值将分摊将布隆过滤器读取到内存的固定成本。 10000000 hoodie.bloom
解决[FLINK-27247]问题。 解决Flink通过代理用户访问普通集群Hive失败问题。 解决磁盘不可用告警无具体盘符问题。 解决阈值告警平滑次数偶现不生效,导致阈值告警频繁上报的问题。 解决GaussDB健康检查异常,导致实例重启问题(root补丁修复)。 解决GaussDB异常时,acs无自恢复能力的问题。
er2x > 默认”,“SPARK_DRIVER_MEMORY”参数默认值为4G。若参数值调整后,仍偶现告警,可按0.5倍速率调大。若告警次数比较频繁,可以按1倍速率调大。多业务量、高并发的情况可以考虑增加实例。 重启所有的JDBCServer2x实例。 重启实例期间实例不可用,当前实例节点的任务会执行失败。
预期,当资源组排队数超过该组最大排队数(maxQueued)时,会导致新的任务无法执行。 可能原因 资源组配置不合理或该资源组下提交的任务过多。 处理步骤 选择“集群 > 待操作集群的名称 > 服务 > Presto > 配置 > 全部配置”,修改“resource-groups”的值调整资源组配置,修改“
已经获取的数据不回退。 说明: “generic-jdbc-connector”的“MYSQL”和“MPPDB”默认批量读写数据,每一批次数据最多只记录一次错误记录。 脏数据目录 设置一个脏数据目录,在出现脏数据的场景中在该目录保存脏数据。如果不设置则不保存。 单击“保存”。 查看作业
预期,当资源组排队数超过该组最大排队数(maxQueued)时,会导致新的任务无法执行。 可能原因 资源组配置不合理或该资源组下提交的任务过多。 处理步骤 用户可通过“组件管理 > Presto > 服务配置(将“基础配置”切换为“全部配置”) >Presto > resource-groups”调整资源组的配置。
ob才可以恢复。另外,如果配置了重启策略为none,但Job设置了Checkpoint,默认会将重启策略改为fixed-delay,且重试次数是配置项“restart-strategy.fixed-delay.attempts”的值。 三种策略的具体信息请参考Flink官网:https://ci
预期,当资源组排队数超过该组最大排队数(maxQueued)时,会导致新的任务无法执行。 可能原因 资源组配置不合理或该资源组下提交的任务过多。 处理步骤 用户可通过“组件管理 > Presto > 服务配置(将“基础配置”切换为“全部配置”) >Presto > resource-groups”调整资源组的配置。
名称。 port指的是服务器的监测端口。 delimiter指的是消息之间的分隔符。 maxRetry指的是由于连接异常可以触发的最大重试次数。 public DataStreamSource<String> socketTextStream(String hostname, int