搜索_华为云

聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回一组有序值中的最后一个值。 LISTAGG(expression [, separator]) 连接字符串表达式的值并在它们之间放置分隔符值。字符串末尾不添加分隔符时则分隔符的默认值为“,”。父主题：内置函数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
使用Hive语法创建DLI表 - 数据湖探索 DLI

SEQUENCEFILE, RCFILE, PARQUET几种格式。创建DLI表时必须指定此关键字。 TBLPROPERTIES：用于为表添加key/value的属性。在表存储格式为PARQUET时，可以通过指定TBLPROPERTIES(parquet.compression

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

MOR表时，建议开启log index特性提升Flink流读性能 Hudi的Mor表可以通过log index提升读写性能， Sink和Source表添加属性 'hoodie.log.index.enabled'='true' 创建Flink OpenSource SQL作业时，在作业编辑界

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1 CREATE FUNCTION udf_test AS 'com.huaweicompany

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1 CREATE FUNCTION udf_test AS 'com.huaweicompany

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
查看指定表所有分区 - 数据湖探索 DLI

语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。参数说明表1 参数描述参数描述 db_name Da

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
新建Flink Jar作业 - 数据湖探索 DLI

用户已上传到DLI资源管理系统的资源包名，用户自定义作业的依赖文件。示例："myGroup/test.cvs,myGroup/test1.csv"。通过在应用程序中添加以下内容可访问对应的依赖文件。其中，“fileName”为需要访问的文件名，“ClassName”为需要访问该文件的类名。 ClassName

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

如您的组织已经设定DLI的相关标签策略，则需按照标签策略规则为资源添加标签。标签如果不符合标签策略的规则，则可能会导致资源创建失败，请联系组织管理员了解标签策略详情。具体请参考《标签管理服务用户指南》。说明：最多支持20个标签。一个“键”只能添加一个“值”。每个资源中的键名不能重复。标签键：在输入框中输入标签键名称。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

使用kafka解析Debezium Json数据，并将结果输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用DataSource语法创建OBS表 - 数据湖探索 DLI

性能文件系统，提供毫秒级别访问时延，TB/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时不会统计大小。添加数据时会修改大小至0。如需查看表大小可以通过OBS查看。 CTAS建表语句不能指定表的属性。 OBS目录下包含子目录的场景：创建表时，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

配置”主类（--class）”，为上一步中所写的，包含需要执行的main函数的类的全名。在”Spark参数（--conf）“处也可以配置Hudi参数，但是需要额外添加前缀“spark.hadoop.“，例如： spark.hadoop.hoodie.write.lock.provider=com.huawei

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Hudi Clustering操作说明 - 数据湖探索 DLI

入了Clustering服务来重写数据以优化Hudi数据湖文件的布局。 Clustering服务可以异步或同步运行，Clustering会添加了一种新的REPLACE操作类型，该操作类型将在Hudi元数据时间轴中标记Clustering操作。 Clustering服务基于Hudi

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

output_format_classname partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression row_format

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Hudi常见配置参数 - 数据湖探索 DLI

datasource API的option来配置。或者，在提交作业时配置到"Spark参数(--conf)" 中，注意，此处配置的参数，键需要添加前缀 ”spark.hadoop.”，例如”spark.hadoop.hoodie.compact.inline=true” 写入操作配置

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

4000.0 | 2 Aggregate Functions 所有的聚合函数都能通过添加over子句来当做窗口函数使用。聚合函数将在当前窗口框架下的每行记录进行运算。下面的查询生成每个职员按天计算的订单价格的滚动总和。 select dept,userid,sal,sum(sal)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
查看Flink作业详情 - 数据湖探索 DLI

作业所选的Flink作业的版本。所属队列 Flink作业所属的队列名称。 UDF Jar 配置UDF Jar参数时显示。优化参数作业添加了自定义参数配置时显示该参数。 CU数量作业配置的CU数量。管理单元作业配置的管理单元CU数量。并行数作业配置的同时运行Flink作业的任务数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

string3, ...) 返回将 STRING2， STRING3， … 与分隔符 STRING1 连接起来的字符串。在要连接的字符串之间添加分隔符。如果 STRING1 为 NULL，则返回 NULL。与 concat() 相比，concat_ws() 会自动跳过 NULL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

PARTITION时，如果使用类型化文字（例如date'2020-01-01'），分区值会被解析为字符串值date'2020-01-01'，会生成一个非法的日期值，因此会添加一个值为null的分区。正确的做法是使用字符串值，例如ADD PARTITION(dt = '2020-01-01') Spark3.3

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

连接容器镜像服务。登录SWR管理控制台。选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。在安装容器引擎的虚拟机中执行上一步复制的登录指令。创建容器镜像组织。如果已创建组织则本步骤可以忽略。登录SWR管理控制台。选择左侧导航栏的“组织管理”，单击页面右上角的“创建组织”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作

总条数： 459

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

聚合函数 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

标示符 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线