检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Flink流式读Hudi表建议 设置合理的消费参数避免File Not Found问题 当下游消费Hudi过慢,上游写入端会把Hudi文件归档,导致File Not Found问题。优化建议如下: 调大read.tasks。 如果有限流则调大限流参数。 调大上游compaction、archive、clean参数。
FlinkSQL HBase数据表开发规则 提前在HBase中创建表 Flink作业在HBase中找不到对应表会报错,所以需要提前在HBase中创建好对应的表。 HBase与Flink不在同一集群时只支持Flink和HBase均为普通模式集群的对接 当HBase与Flink为同一
FlinkSQL Hive表开发规则 提前在Hive中创建表 Flink作业在Hive中找不到对应表会报错,所以需要提前在Hive客户端创建好对应的表。 FlinkServer对接Hive使用对接MetaStore的方式,故需要Hive开启MetaStore功能。 查看Hive是否开启MetaStore功能:
FlinkSQL Hive表开发建议 FlinkServer对接Hive时创建集群连接 以具有FlinkServer管理员权限的用户访问FlinkServer WebUI界面,选择“系统管理 > 集群连接管理”,进入集群连接管理页面。 单击“创建集群连接”,在弹出的页面中填写集群
FlinkSQL Redis表开发建议 Sink表设置合适的批写参数 sink.batch.max-size:开启批写Redis并设置批写数量(正整数),单位:条。“-1”表示不开启批写Redis。 开启该功能可提升大数据场景下性能表现,但不适合对实时性要求过高的场景,建议批写数量不超过30000。
ClickHouseBalancer实例IP2:ClickHouseBalancer端口/default', Sink表配置合适的攒批参数 攒批写参数: Flink会将数据先放入内存,到达触发条件时再flush到数据库表中。 相关配置如下: sink.buffer-flush.max-rows:攒批写ClickHouse的行数,默认100。
FlinkSQL Doris数据表开发规则 提前在Doris中创建表: Flink作业在Doris中找不到对应表会报错,所以需要提前在Doris中创建好对应的表。 Doris作为Sink表时需开启CheckPoint: Flink作业在触发CheckPoint时才会往Doris表中写数据。 父主题:
'kerberos' ); 开启异步Lookup Join提升维表Join性能 在HBase维表with中添加如下属性: 'lookup.async'='true' 调大Lookup Join算子并行度提升维表Join性能 在HBase维表with中添加如下属性: 'lookup.parallelism'='xx'
FlinkSQL DWS表开发建议 FlinkSQL DWS表开发建议 开发FlinkSQL DWS作业,DWS可以作为源表、结果表和维表。 开发FlinkSQL DWS表请参考Flink SQL概述。 父主题: FlinkSQL Connector开发规范
FlinkSQL DWS表开发规则 提前在DWS中创建表 若开发FlinkSQL DWS表作业,需要在DWS中创建数据表。 由于Flink作业在DWS中找不到对应表会报错,所以需要提前在DWS中创建好用于接收数据的空表。 父主题: FlinkSQL Connector开发规范
FlinkSQL JDBC表开发规则 提前在对应数据库中创建表 JDBC作为sink表时,需要提前在对应数据库(如MySQL)中创建好用于接收数据的空表。 JDBC作为维表时,需要提前在对应数据库(如MySQL)中创建好维度表。 父主题: FlinkSQL Connector开发规范
FlinkSQL Kafka表开发建议 Kafka作为source表时应设置限流 本章节适用于MRS 3.3.0及以后版本。 防止上限超过流量峰值,导致作业异常带来不稳定因素。因此建议设置限流,限流上限应该为业务上线压测的峰值。 【示例】 #如下参数作用在每个并行度 'scan.records-per-second
不能同时设置“topic-pattern”和“topic”配置项 topic-pattern:主题模式,用于source表,可使用正则表达式的主题名称。 【示例】以下source表将订阅所有以“test-topic-”开头,单个数字结尾的主题消息: CREATE TABLE payments
FlinkSQL JDBC表开发建议 Flink SQL与JDBC数据类型对应关系 参考表1开发Flink SQL作业。 表1 Flink SQL与JDBC数据类型对应关系 Flink SQL数据类型 MySQL数据类型 Oracle数据类型 PostgreSQL数据类型 SQL
ALM-16001 Hive数据仓库空间使用率超过阈值 告警解释 系统每30秒周期性检测Hive数据仓库空间使用率,该指标可在Hive服务监控界面查看,指标名称为“Hive已经使用的HDFS空间占可使用空间的百分比”。Hive数据仓库空间使用率指标默认提供一个阈值范围(85%),
FlinkSQL ClickHouse表开发规则 提前在ClickHouse中创建表 Flink作业在ClickHouse中找不到对应表会报错,所以需提前在ClickHouse中创建好对应的表。 Flink写ClickHouse不支持删除操作 由于不支持删除操作,Flink无法对
ClickHouse宽表设计 ClickHouse宽表设计原则 ClickHouse表字段设计 ClickHouse本地表设计 ClickHouse分布式表设计 ClickHouse分区设计 ClickHouse索引设计 父主题: ClickHouse应用开发规范
FlinkSQL Elasticsearch表开发规则 Flink支持1.12.2及以后版本,Elasticsearch支持7.10.2及以后版本。 安全模式的Flink对接普通模式的Elasticsearch集群需设置参数“es.security.indication”的值为“false”
FlinkSQL Elasticsearch表开发建议 FlinkSQL Elasticsearch作业,参数配置如下: 表1 Flink作业With属性 参数 是否必选 数据类型 描述 connector 必选 String 指定要使用的连接器,如elasticsearch-7,即连接到Elasticsearch
my_table_local, rand()); 使用说明 分布式表名称:default.my_table_dis。 本地表名称:default.my_table_local。 通过“AS”关联分布式表和本地表,保证分布式表的字段定义跟本地表一致。 分布式表引擎的参数说明: default_cluster:集群名称。