搜索_华为云

弹性资源池CU设置 - 数据湖探索 DLI

该队列最小CU为256CU时，因为受到CU最大设置的控制，该队列不能添加到该弹性资源池。注意事项在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。在全天的任意一个时间段内，弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Hudi Clean操作说明 - 数据湖探索 DLI

commits.retained=10 // 默认值为10，根据业务场景指定随后执行SQL，当Timeline中有10个以上的Instant记录时，会触发clean run clean on ${table_name} 父主题：数据管理维护

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

名称。 table_name 需要执行INSERT命令的表的名称。 part_spec 指定详细的分区信息。若分区字段为多个字段，需要包含所有的字段，但是可以不包含对应的值，系统会匹配上对应的分区。单表分区数最多允许100000个。 select_statement 源表上的SE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
GROUP BY中使用HAVING - 数据湖探索 DLI

先依据num对表transactions进行分组，再利用HAVING子句对查询结果进行过滤，price与amount乘积的最大值大于5000的记录将被筛选出来，返回对应的num及price与amount乘积的最大值。 1 2 3 4 SELECT num, max(price*amount)

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
通过DLI跨源写DWS表，非空字段出现空值异常怎么办？ - 数据湖探索 DLI

DLI源表对应字段cir为double类型。图1 创建源表目标表对应字段类型为decimal(9,6)。图2 创建目标表查询源表数据，发现导致问题产生的记录ctr值为1675，整数位（4位）超出所定义的decimal精度（9 – 6 = 3位），导致double转decimal时overflo

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
创建DLI表关联DCS - 数据湖探索 DLI

读取数据时，并发task数。 scan.count 每批次读取的数据记录数，默认为100。如果在读取过程中，redis集群中的CPU使用率还有提升空间，可以调大该参数。 iterator.grouping.size 每批次插入的数据记录数，默认为100。如果在插入过程中，redis集群中的C

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
创建DLI表关联DWS - 数据湖探索 DLI

id < 100。 fetchsize 读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
集合操作 - 数据湖探索 DLI
集合操作 - 数据湖探索 DLI

同，列名不一定要相同。 UNION默认是去重的，UNION ALL是不去重的。示例输出Orders1和Orders2的并集，不包含重复记录。 1 2 insert into temp SELECT * FROM Orders1 UNION SELECT * FROM Orders2;

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
集合操作 - 数据湖探索 DLI
集合操作 - 数据湖探索 DLI

同，列名不一定要相同。 UNION默认是去重的，UNION ALL是不去重的。示例输出Orders1和Orders2的并集，不包含重复记录。 1 2 insert into temp SELECT * FROM Orders1 UNION SELECT * FROM Orders2;

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
集合操作 - 数据湖探索 DLI
集合操作 - 数据湖探索 DLI

同，列名不一定要相同。 UNION默认是去重的，UNION ALL是不去重的。示例输出Orders1和Orders2的并集，不包含重复记录。 1 2 insert into temp SELECT * FROM Orders1 UNION SELECT * FROM Orders2;

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
聚合函数概览 - 数据湖探索 DLI

col2) DOUBLE 返回两列数值的相关系数。 count count([distinct|all] <colname>) BIGINT 返回记录条数。 covar_pop covar_pop(col1, col2) DOUBLE 返回两列数值协方差。 covar_samp covar_samp(col1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
FileSystem结果表 - 数据湖探索 DLI

下游系统将不能安全读取该文件数据。 sink end算子的接受记录数为checkpoint的个数，非实际的发送数据，实际发送数据量请参考streaming-writer或StreamingFileWriter算子的记录数。语法格式 1 2 3 4 5 6 7 8

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建DLI表关联RDS - 数据湖探索 DLI

id < 100。 fetchsize 读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

时间函数 Flink OpenSource SQL所支持的时间函数如表1所示。函数说明表1 时间函数函数返回值描述 DATE string DATE 将日期字符串以"yyyy-MM-dd"的形式解析为SQL日期。 TIME string TIME 将时间字符串以"HH:mm:ss[

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

源的大小是按需分配的。用户在不确定所需队列容量或没有可创建队列空间的情况下，可以使用该队列执行作业。“default”队列只用于用户体验，所有人共用，用户间可能会出现抢占资源的情况，不能保证每次都可以得到资源执行相关操作。发布区域：全部弹性资源池和队列简介 OBS 2.0支持

 帮助中心 > 数据湖探索 DLI > 功能总览
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

作业使用Flink1.15版本、且已在作业中配置允许DLI访问DEW的委托信息。自定义委托及配置请参考自定义DLI委托权限。使用该功能，所有涉及OBS的桶，都需要进行配置AKSK。语法格式在Flink jar作业编辑界面，选择配置优化参数，配置信息如下: 不同的OBS桶，使用不同的AKSK认证信息。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1 Flink作业配置参数对于Flink Jar作业，您需要在代码中开启Checkpoint，

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
对象存储OBS结果表 - 数据湖探索 DLI

下游系统将不能安全读取该文件数据。 sink end算子的接受记录数为checkpoint的个数，非实际的发送数据，实际发送数据量请参考streaming-writer或StreamingFileWriter算子的记录数。注意事项请在Flink“作业编辑”页面选择“运行参数配

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

'2021-08-28'); 随后可以在编辑器下方的”执行历史（最近一天）”窗格中检查执行结果，或者点击左侧”作业管理”-> ”SQL作业”跳转到SQL作业记录中检查。在执行SQL的时候配置Hudi参数： DLI不支持直接使用SET语句配置参数点击”设置”，随后在”参数设置”一栏可以配置键和值

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Upsert Kafka结果表 - 数据湖探索 DLI

bootstrap.servers 是 kafka brokers地址，以逗号分隔 connector.sink-partitioner 否记录分区方式，支持：'fixed', 'round-robin'及'custom' connector.sink-partitioner-class

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 622

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

弹性资源池CU设置 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

GROUP BY中使用HAVING - 数据湖探索 DLI

通过DLI跨源写DWS表，非空字段出现空值异常怎么办？ - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

集合操作 - 数据湖探索 DLI

集合操作 - 数据湖探索 DLI

集合操作 - 数据湖探索 DLI

聚合函数概览 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线