搜索_华为云

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

而且在延迟时间内到达的每个数据都会更新输出结果。说明：当时间窗口为处理时间时，无论lateness_interval为何值，都不会有效果。 period_interval和lateness_interval不可为负数。当period_interval为0时，表示没有使用窗口的周期触发策略；

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
userDefined结果表 - 数据湖探索 DLI

userDefined结果表功能描述您可通过编写代码实现将DLI处理之后的数据写入到指定的云生态或者开源生态。前提条件已编写代码实现自定义sink类：自定义sink类需要继承Flink开源类：RichSinkFunction，并指定数据类型为：Tuple2<Boolean

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
显示函数详情 - 数据湖探索 DLI

[EXTENDED] [db_name.] function_name; 关键字 EXTENDED：显示扩展使用信息。注意事项返回已有函数的元数据（实现类和用法），如果函数不存在，则系统报错。示例查看函数mergeBill的相关信息。 1 DESCRIBE FUNCTION mergeBill;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
Flink作业性能调优 - 数据湖探索 DLI

WHEN flag IN ('android', 'iphone')THEN user_id ELSE NULL END) AS app_uv 可调整为 COUNT(DISTINCT user_id) FILTER(WHERE flag IN ('android', 'iphone'))

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Hudi锁配置说明 - 数据湖探索 DLI

n提供的Hudi锁实现类。配置项配置值 hoodie.write.lock.provider org.apache.hudi.lakeformation.LakeCatMetastoreBasedLockProvider 关闭Hudi锁，或者使用其他的锁实现类时，存在数据丢失/异常的风险。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 <dependency> <groupId>org

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
ALTER VIEW - 数据湖探索 DLI
ALTER VIEW - 数据湖探索 DLI

table_properties; 描述 “ALTER VIEW view_name AS select_statement;”用于改变已存在的视图的定义，语法效果与CREATE OR REPLACE VIEW类似。 “ALTER VIEW view_name SET TBLPROPERTIES ta

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

class MySource extends RichParallelSourceFunction<Row>{}，重点实现其中的open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency>

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
CREATE FUNCTION语句 - 数据湖探索 DLI

中，已经有同名的函数注册了，则无法注册。如果 language tag 是 JAVA 或者 SCALA ，则 identifier 是 UDF 实现类的全限定名。如果您需要了解创建自定义函数的步骤请参考自定义函数。语法定义 CREATE [TEMPORARY|TEMPORARY SYSTEM]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

QL便可实现海量数据查询分析。SQL语法全兼容标准ANSI SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算资源按租户隔离，数据权限控制到队列、作业，帮助企业实现部门间的数据共享和权限管理。

帮助中心 > 数据湖探索 DLI > 产品介绍
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

创建一个Kafka源表，用来从Kafka指定Topic中读取消费数据；创建一个结果表，用来通过JDBC向MySQL中写入结果数据。实现相应的处理逻辑，以实现各个指标的统计。为了简化最终的处理逻辑，使用创建视图进行数据预处理。利用over窗口条件和过滤条件结合以去除重复数据（该方式是利用了top

帮助中心 > 数据湖探索 DLI > 最佳实践
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
SORT BY - 数据湖探索 DLI
SORT BY - 数据湖探索 DLI

SORT BY 功能描述按字段实现表的局部排序。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference SORT BY col_name [ASC | DESC] [,col_name [ASC | DESC],..

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
ROLLUP - 数据湖探索 DLI
ROLLUP - 数据湖探索 DLI

ROLLUP 功能描述 ROLLUP生成聚合行、超聚合行和总计行。可以实现从右到左递减多级的统计，显示统计某一层次结构的聚合。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

GROUPING SETS 功能描述 GROUPING SETS生成交叉表格行，可以实现GROUP BY字段的交叉统计。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
CLUSTER BY - 数据湖探索 DLI
CLUSTER BY - 数据湖探索 DLI

CLUSTER BY 功能描述按字段实现表的分桶及桶内排序。语法格式 1 2 SELECT attr_expr_list FROM table_reference CLUSTER BY col_name [,col_name ,...]; 关键字 CLUSTER BY：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
DISTRIBUTE BY - 数据湖探索 DLI
DISTRIBUTE BY - 数据湖探索 DLI

DISTRIBUTE BY 功能描述按字段实现表的分桶。语法格式 1 2 SELECT attr_expr_list FROM table_reference DISTRIBUTE BY col_name [,col_name ,...]; 关键字 DISTRIBUTE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。操作流程图1 配置DLI队列访问公网流程步骤1：创建VPC

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

DLI增强型跨源连接创建对等连接的主要原因是为了实现DLI与不同VPC中的数据源之间的网络连通。当DLI需要访问外部数据源，而这些数据源位于不同的VPC中时，由于网络隔离，DLI默认无法直接读取这些数据源的数据。通过创建增强型跨源连接，可以采用对等连接的方式打通DLI与数据源的VPC网络，从而实现数据的互通和跨源分析。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类

总条数： 139

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

显示函数详情 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

Hudi锁配置说明 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

ALTER VIEW - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

SORT BY - 数据湖探索 DLI

ROLLUP - 数据湖探索 DLI

GROUPING SETS - 数据湖探索 DLI

CLUSTER BY - 数据湖探索 DLI

DISTRIBUTE BY - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线