搜索_华为云

EdgeHub输出流（EOS） - 数据湖探索 DLI

EdgeHub输出流（EOS）功能描述 DLI将边缘作业分析处理过的数据，写入到EdgeHub中，便于后续进行处理。适用于物联网IOT场景，将实时流计算能力从云端延伸到边缘，在边缘快速实现对流数据实时、快速、准确地分析处理，增加数据处理计算的速度和效率。同时将数据在边缘预处理

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较）。结果中包含一行的概率与任何其他行无关。这不会减少从磁盘读取采样表所需的时间。如果进一步处理采样输出，则可能会影响总查询时间。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业本章节主要介绍从创建弹性资源池、创建增强型跨源、添加队列到弹性资源池并运行作业的一个完整流程，帮助您更好、更方便的使用弹性资源池。图1 创建弹性资源池运行作业流程图表1 创建新队列时绑定弹性资源池流程说明阶段说明参考文档步骤一：创建弹性资源池

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用DLI进行车联网场景驾驶行为数据分析 - 数据湖探索 DLI

emo。OBS Browser+提供强大的拖拽上传功能，您可以将本地的一个或多个文件或者文件夹拖拽到对象存储的对象列表或者并行文件系统的对象列表中；同时您也可以将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_01.zip获取本示例的

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
Flink OpenSource SQL作业开发 - 数据湖探索 DLI

OpenSource SQL作业开发从Kafka读取数据写入到RDS 从Kafka读取数据写入到DWS 从Kafka读取数据写入到Elasticsearch 从MySQL CDC源表读取数据写入到DWS 从PostgreSQL CDC源表读取数据写入到DWS Flink作业高可靠推荐配置指导（异常自动重启）

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
OVER子句 - 数据湖探索 DLI
OVER子句 - 数据湖探索 DLI

CURRENT ROW AND CURRENT ROW 窗口从当前行向前数3行开始，到当前行向后数5行结束。 1 ROWS BETWEEN 3 PRECEDING AND 5 FOLLOWING 窗口从表或分区的开头开始，到当前行结束。 1 ROWS BETWEEN UNBOUNDED

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
OVER - 数据湖探索 DLI
OVER - 数据湖探索 DLI

CURRENT ROW AND CURRENT ROW 窗口从当前行向前数3行开始，到当前行向后数5行结束。 1 ROWS BETWEEN 3 PRECEDING AND 5 FOLLOWING 窗口从表或分区的开头开始，到当前行结束。 1 ROWS BETWEEN UNBOUNDED

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
与其他云服务的关系 - 数据湖探索 DLI

Service）作为DLI的数据来源及数据存储，与DLI配合一起使用，关系有如下两种。数据来源：DLI服务提供DataFrame和SQL方式从CloudTable中导入数据到DLI。存储查询结果：DLI使用标准SQL的Insert语法将日常作业的查询结果数据存放到CloudTable表中。通过

 帮助中心 > 数据湖探索 DLI > 产品介绍
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

通常当作业执行失败、资源异常重启等非人为触发的异常场景时，支持从checkpoint恢复。但是如果修改了作业的运算逻辑，作业的计算逻辑已发生更改，不支持从checkpoint恢复。应用场景本文列举了一些常见的从checkpoint恢复的场景供您参考，如表1所示。更多场景可以使用从checkpoint恢复的原则结合实际情况进行判断。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
lpad - 数据湖探索 DLI
lpad - 数据湖探索 DLI

如果length小于str1的位数，则返回str1从左开始截取length位的字符串。如果length为0，则返回空串。如果没有输入参数或任一输入参数值为NULL，返回NULL。示例代码用字符串ZZ将字符串abcdefgh向左补足到10位。命令示例如下。返回ZZabcdefgh。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
lpad - 数据湖探索 DLI
lpad - 数据湖探索 DLI

如果length小于str1的位数，则返回str1从左开始截取length位的字符串。如果length为0，则返回空串。如果没有输入参数或任一输入参数值为NULL，返回NULL。示例代码用字符串ZZ将字符串abcdefgh向左补足到10位。命令示例如下。返回ZZabcdefgh。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 字符串函数
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

int间隔（权衡执行Checkpoint对业务性能的影响以及异常恢复的时长），同时勾选“异常自动重启”，并勾选“从Checkpoint恢复”。配置后，作业异常重启，会从最新成功的Checkpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

以“HH:mm:ss”的形式返回从字符串解析的 SQL 时间。 TIMESTAMP string TIMESTAMP 以“yyyy-MM-dd HH:mm:ss[.SSS]”的形式返回从字符串解析的 SQL 时间戳。 INTERVAL string range INTERVAL 从“dd hh:mm:ss

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据问题现象使用Flink作业输出流写入数据到了OBS中，通过该OBS文件路径创建的DLI表进行数据查询时，无法查询到数据。例如，使用如下Flink结果表将数据写入到OBS的“obs://obs-sink/car_infos”路径下。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Flink作业性能调优类 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ Flink作业运行异常，如何定位 Flink作业重启后，如何判断是否可以从checkpoint恢复 DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 Jobmanage

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
T-Digest函数 - 数据湖探索 DLI
T-Digest函数 - 数据湖探索 DLI

quantile)→double 描述：给定0到1之间的数字分位数，返回T-digest中的近似百分位值。 values_at_quantiles(tdigest,quantiles)->array(double) 描述：给定一组0到1之间的数字分位数，从T-digest中返回对应的分位数组成的数组。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Quantile digest函数 - 数据湖探索 DLI

quantile) → T 描述：给定0到1之间的数字分位数，返回分位数摘要中的近似百分位值。 values_at_quantiles(qdigest(T), quantiles) -> array(T) 描述：给定一组0到1之间的数字分位数，从分位数摘要中返回对应的近似百分位值组成的数组。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
DLI数据库和表类 - 数据湖探索 DLI

法查询到数据怎么办？为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ SQL作业执行完成后，修改表名导致datasize不正确怎么办？从DLI导入数据到OBS，数据量不一致怎么办？

帮助中心 > 数据湖探索 DLI > 常见问题
Spark2.4.x与Spark3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x版本在通用队列的差异，便于您了解Spark版本升级后通用队列上运行的作业在适配新版本引擎时的影响。 log4j依赖从1.x版本修改为2.x版本说明： log4j依赖从1.x版本修改为2.x版本 Spark2.4.x：log4j依赖1.x版本（社区不再支持）。 Spark3.3.x：log4j依赖2

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark2.4.x与Spark3.3.x版本差异对比
Hudi表分区设计规范 - 数据湖探索 DLI

天的日志是8GB，这个会采用Bucket桶数= 8GB/2GB = 4 来创建表；每天的更新数据占比较高，且主要分散到近一个月。这样会导致结果是，每天的数据会写入到全月的Bucket桶中，那就是4*30 = 120个桶。如果采用月分区，分区桶的个数= 3GB * 30 /2GB =

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范

总条数： 244

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

EdgeHub输出流（EOS） - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

使用DLI进行车联网场景驾驶行为数据分析 - 数据湖探索 DLI

Flink OpenSource SQL作业开发 - 数据湖探索 DLI

OVER子句 - 数据湖探索 DLI

OVER - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

lpad - 数据湖探索 DLI

lpad - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

Flink作业性能调优类 - 数据湖探索 DLI

T-Digest函数 - 数据湖探索 DLI

Quantile digest函数 - 数据湖探索 DLI

DLI数据库和表类 - 数据湖探索 DLI

Spark2.4.x与Spark3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线