搜索_华为云

Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

代表最大或最小的 N 条记录会被保留。 [AND conditions]: 在 where 语句中，可以随意添加其他的查询条件，但其他条件只允许通过 AND 与 rownum <= N 结合使用。注意事项 TopN 查询的结果会带有更新。 Flink SQL 会根据排序键对输入的流进行排序。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
配置Hudi数据列默认值 - 数据湖探索 DLI

列的默认值不会影响历史数据的查询结果。设置默认值后rollback不能回滚默认值配置。 Spark SQL暂不支持查看列默认值信息，可以通过执行show create table SQL查看。不支持默认缺省列的写入方式，写入时必须指定列名。支持范围当前仅支持int、big

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
使用Hive语法创建DLI表 - 数据湖探索 DLI

PARQUET几种格式。创建DLI表时必须指定此关键字。 TBLPROPERTIES：用于为表添加key/value的属性。在表存储格式为PARQUET时，可以通过指定TBLPROPERTIES(parquet.compression = 'zstd')来指定表压缩格式为zstd。 AS：使用CTAS创建表。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
使用DataSource语法创建DLI表 - 数据湖探索 DLI

可以使用如下的SELECT语句“SELECT col_1 FROM table1 WHERE col_1 = 'Ann' ”，这样就可以通过执行SELECT语句从table1中单独选定col_1，并只将其中值等于'Ann'的数据插入到table1_ctas中。 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否访问数据库所需要的账号 connector.password 否访问数据库所需要的密码

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
查询作业列表 - 数据湖探索 DLI

Integer 空闲状态过期周期。 udf_jar_url 否 String 用户已上传到DLI资源管理系统的程序包名，用户sql作业的udf jar通过该参数传入。 dirty_data_strategy 否 String 作业脏数据策略。 “2:obsDir”：保存，obsDir表示脏数据存储路径。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

Managers”，单击对应的任务名称，选择“Stdout”查看作业运行日志。方法二：若在提交运行作业前“运行参数”选择了“保存作业日志”，可以通过如下操作查看。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数 > 表值函数
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

Managers”，单击对应的任务名称，选择“Stdout”查看作业运行日志。方法二：如果在提交运行作业前“运行参数”选择了“保存作业日志”，可以通过如下操作查看。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数 > 表值函数
查询作业详情 - 数据湖探索 DLI

用户上传的config包OBS路径。 udf_jar_url 否 String 用户已上传到DLI资源管理系统的程序包名，用户sql作业的udf jar通过该参数传入。 dirty_data_strategy 否 String 作业脏数据策略。 “2:obsDir”：保存，obsDir表示脏数据存储路径。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

DLI支持的Prometheus基础监控指标表1提供了DLI支持的Prometheus基础监控指标，AOM Prometheus支持免费存储基础指标。除基础指标外，AOM Prometheus提供的自定义指标按计费规则付费使用。表1 DLI支持的Prometheus监控指标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
Hudi数据表Clean规范 - 数据湖探索 DLI

MOR表下游采用流式计算，历史版本保留小时级。如果MOR表的下游是流式计算，例如Flink流读，可以按照业务需要保留小时级的历史版本，这样的话近几个小时之内的增量数据可以通过log文件读出，如果保留时长过短，下游flink作业在重启或者异常中断阻塞的情况下，上游增量数据已经Clean掉了，flink需要从par

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hudi表分区设计规范 - 数据湖探索 DLI

律的，比如：近一个月的数据更新占比最大，可以按照月份创建分区；近一天内的数据更新占比大，可以按照天进行分区。采用Bucket索引，写入是通过主键Hash打散的，数据会均匀的写入到分区下每个桶。因为各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
类型转换函数 - 数据湖探索 DLI

Managers”，单击对应的任务名称，选择“Stdout”查看作业运行日志。方法二：若在提交运行作业前“运行参数”选择了“保存作业日志”，可以通过如下操作查看。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

throws DLIException { System.out.println("list all batch jobs..."); // 通过调用DLIClient对象的listAllBatchJobs方法查询批处理作业 String queueName = "queueName";

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
使用Hive语法创建OBS表 - 数据湖探索 DLI

s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时会统计大小。添加数据时不会修改大小。如需查看表大小可以通过OBS查看。 CTAS建表语句不能指定表的属性。关于分区表的使用说明：创建分区表时，PARTITONED BY中指定分区列必须是不在表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

配表达式。规则匹配表达式首尾的空格，不会参与匹配计算。 partition_spec 一个可选参数，使用键值对来指定分区列表，键值对之间通过逗号分隔。需要注意，指定分区时，表名不支持模糊匹配。示例 -- 演示数据准备 create schema show_schema; create

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
类型转换函数 - 数据湖探索 DLI

Managers”，单击对应的任务名称，选择“Stdout”查看作业运行日志。方法二：如果在提交运行作业前“运行参数”选择了“保存作业日志”，可以通过如下操作查看。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
创建JDBC维表 - 数据湖探索 DLI
创建JDBC维表 - 数据湖探索 DLI

connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否数据库认证用户名，需要和'connector.password'一起配置 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

SELECT COUNT(DISTINCT order_id) FROM Orders GROUPING SETS Grouping Sets 可以通过一个标准的 GROUP BY 语句来描述更复杂的分组操作。数据按每个指定的 Grouping Sets 分别分组，并像简单的 group by

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Spark SQL常用配置项说明 - 数据湖探索 DLI

sql.distinct.aggregator.enabled false dli.jobs.sql.resubmit.enable null 通过设置该参数可以控制在driver故障、队列重启时Spark SQL作业是否重新提交。 false：禁用作业重试，所有类型的命令都不重新提交

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考

总条数： 674

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Top-N - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

string_split - 数据湖探索 DLI

string_split - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

创建JDBC维表 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线