搜索_华为云

自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后点击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

使用方式将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后单击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
Lambda 表达式 - 数据湖探索 DLI
Lambda 表达式 - 数据湖探索 DLI

upper(x[1]) || x[2] || x[3]); -- Once upon a time ... 在聚合函数中应用Lambda表达式。如使用reduce_agg()计算一个较为复杂的按列求元素和： SELECT reduce_agg(value, 0, (a, b) -> a + b, (a

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
GROUP BY中使用HAVING - 数据湖探索 DLI

NG子句中可支持算术运算，聚合函数等。示例先依据num对表transactions进行分组，再利用HAVING子句对查询结果进行过滤，price与amount乘积的最大值大于5000的记录将被筛选出来，返回对应的num及price与amount乘积的最大值。 1 2 3 4 SELECT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
ORDER BY - 数据湖探索 DLI
ORDER BY - 数据湖探索 DLI

BY：对全局进行单列或多列排序。与GROUP BY一起使用时，ORDER BY后面可以跟聚合函数。注意事项所排序的表必须是已经存在的，否则会出错。示例根据字段score对表student进行升序排序，并返回排序后的结果。 1 2 SELECT * FROM student ORDER

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch 引擎的索引中。 Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Elasticsearch结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
HAVING - 数据湖探索 DLI
HAVING - 数据湖探索 DLI

IN操作符。注意事项所要查询的表必须是已经存在的表，否则会出错。此处的sub_query与聚合函数的位置不能左右互换。示例对表student_info按字段name进行分组，计算每组中记录数，若其记录数等于子查询中表course_info的记录数，返回表student_i

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

的所有行。在没有ORDER BY的情况下，所有行都被视为对等行，因此未绑定的前导和当前行之间的范围等于未绑定的前导和未绑定的后续之间的范围。例如：下面的查询将salary表中的信息按照每个部门员工工资的大小进行排序。 --创建数据表并插入数据 create table salary

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Elasticsearch结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
ClickHouse结果表 - 数据湖探索 DLI

数据库名为ClickHouse集群创建的数据库名称。 connector.table 是要创建的ClickHouse的表名。 connector.driver 否连接数据库所需要的驱动。如果建表时不指定该参数，驱动会自动通过ClickHouse的url提取。如果建表时指定该参数，则该参数值固定为“ru

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
按表达式GROUP BY - 数据湖探索 DLI

字段，也可以是聚合函数，字符串函数等。注意事项所要分组的表必须是已经存在的表，否则会出错。同单列分组，GROUP BY中出现的字段必须包含在attr_expr_list的字段中，表达式支持内置函数，自定义函数等。示例先利用substr函数取字段name的子字符串，并按照

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

群所在的虚拟私有云和子网分别创建跨源连接，并绑定所要使用的Flink弹性资源池。设置ClickHouse和Kafka集群安全组的入向规则，使其对当前将要使用的Flink作业队列网段放通。参考测试地址连通性根据ClickHouse和Kafka的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功，否则表示未成功。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
浮点型 - 数据湖探索 DLI
浮点型 - 数据湖探索 DLI

由于每次执行的顺序不一样，在调用聚合函数，比如SUM()，AVG()，特别是当数据规模非常大时，达到数千万甚至数十亿，其运算结果可能会略有不同。这种情况下，建议使用DECIMAL数据类型来运算。可以使用别名来指定数据类型。示例： --创建具有float类型数据的表 CREATE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
ClickHouse结果表 - 数据湖探索 DLI

kHouse和Kafka集群所在的虚拟私有云和子网分别创建跨源连接，并绑定所要使用的Flink作业队列。设置ClickHouse和Kafka集群安全组的入向规则，使其对当前将要使用的Flink作业队列网段放通。参考测试地址连通性根据ClickHouse和Kafka的地址测试队列

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Spark SQL常用配置项说明 - 数据湖探索 DLI

并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

task在运行，即为数据倾斜的情况。图1 数据倾斜样例常见数据倾斜场景 Group By聚合倾斜在执行Group By聚合操作时，如果某些分组键对应的数据量特别大，而其他分组键对应的数据量很小，在聚合过程中，数据量大的分组会占用更多的计算资源和时间，导致处理速度变慢，出现数据倾斜。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

本节操作介绍删除分区表的一个或多个分区。分区表分为两种，OBS表和DLI表。在删除分区时，DLI表和OBS表都支持利用指定条件删除分区表的一个或多个分区。OBS表还支持按指定筛选条件删除分区。注意事项所要删除分区的表必须是已经存在的表，否则会出错。所要删除的分区必须是已经存在的，否则会出错，可通过语句中添加“IF

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
提交SQL作业（推荐） - 数据湖探索 DLI

并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
使用Hive语法创建DLI表 - 数据湖探索 DLI

使用Hive语法创建DLI表。DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。注意事项 CTAS建表语句不能指定表的属性。 Hive DLI表不支持在建表时指定多字符的分隔符。关于分区表的使用说明：创建分区表时，PARTITONED

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表

总条数： 828

上一页
1
2
3
4
5
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自定义函数 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

Lambda 表达式 - 数据湖探索 DLI

GROUP BY中使用HAVING - 数据湖探索 DLI

ORDER BY - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

HAVING - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

按表达式GROUP BY - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

浮点型 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线