搜索_华为云

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

VALUES('Adam','68','25'); 查询表数据： select * from hiveobstable; 图19 查询结果在OBS桶“obs://dli-test-021/data5”目录下刷新后查询，生成了两个数据文件，分别对应新插入的数据。图20 查询结果创建表字段为复杂数据格式的OBS表

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
列别名 - 数据湖探索 DLI
列别名 - 数据湖探索 DLI

AS：是否添加此关键字不会影响结果。注意事项所要查询的表必须是已经存在的，否则会出错。别名的命名必须在别名的使用之前，否则会出错。此外，建议不要重名。示例先通过子查询SELECT name AS n FROM simple_table WHERE score > 90获得结果，在子查询中给name起的别名n可直接用于外部SELECT语句。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 别名SELECT
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

BY里，每个分组只输出一条记录，包括以下几种：分组函数在流处理表中的 SQL 查询中，分组窗口函数的 time_attr 参数必须引用一个合法的时间属性，且该属性需要指定行的处理时间或事件时间。对于批处理的 SQL 查询，分组窗口函数的 time_attr 参数必须是一个 TIMESTAMP

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
HAVING - 数据湖探索 DLI
HAVING - 数据湖探索 DLI

HAVING 功能描述在HAVING子句中嵌套子查询，子查询结果将作为HAVING子句的一部分。语法格式 1 2 3 SELECT [ALL | DISTINCT] attr_expr_list FROM table_reference GROUP BY groupby_expression

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
SQL作业访问报错：File not Found - 数据湖探索 DLI

检查文件路径、文件名。检查文件的路径是否正确，包括目录名称和文件名。文件被占用文件被占用导致的文件报错找不到，一般是读写冲突产生的，建议查询SQL查询报错表的时候，是否有作业正在覆盖写对应数据。父主题： SQL作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Delta清理和优化 - 数据湖探索 DLI

delta_table0; VACUUM delta_table0 RETAIN 168 HOURS;--单位只支持HOURS 优化Delta表为了提高查询速度，Delta Lake支持优化数据在存储中的布局，这会将许多较小的文件压缩为较大的文件。 optimize delta_table0;

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
使用Hive语法创建OBS表 - 数据湖探索 DLI

/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时会统计大小。添加数据时不会修改大小。如需查看表大小可以通过OBS查看。 CTAS建表语句不能指定表的属性。关于分区表的使用说明：创建分区表时，PARTITONED BY中指定分区列必须是不在

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

ROW FORMAT... 空值分区的查询语句不同说明： Spark2.4.x： Spark 3.0.1或更早版本中，如果分区列是字符串类型，则将其解析为其文本表示形式的字符串文本，例如字符串“null”。通过part_col='null'查询空值分区的数据。 Spark3.3.x：

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
DLI对接LakeFormation - 数据湖探索 DLI

服务。操作流程图1 操作流程约束限制在表1中提供了支持对接LakeFormation获取元数据的队列和引擎类型。查看队列的引擎类型和版本请参考查看队列的基本信息。表1 LakeFormation获取元数据的队列和引擎类型队列类型引擎类型和支持的版本 default队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

通过文本编辑器打开数据文件，发现数据量缺失。根据该验证方式，初步定位是因为文件数据量较大，文本编辑器无法全部读取。通过执行查询语句，查询OBS数据进一步进行确认，查询结果确认数据量正确。因此，该问题为验证方式不正确造成。参考信息插入数据的SQL语法，请参考《数据湖探索Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
first - 数据湖探索 DLI
first - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。 frame_clause 否用于确定数据边界。返回值说明参数的数据类型。示例代码示例数据为便于理解函数的使用方法，本文

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
last - 数据湖探索 DLI
last - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。 frame_clause 否用于确定数据边界。返回值说明参数的数据类型。示例代码为便于理解函数的使用方法，本文为您提供源

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
导入数据（废弃） - 数据湖探索 DLI

如果名称中包含英文句号（.），访问桶或对象时可能会进行安全证书校验。导入源文件时，如果源文件中的某一列与目标表列类型不匹配，将会导致该行数据的查询结果为null 。不支持并发导入同一张表。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

SV数据转换为Parquet数据。方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间

 帮助中心 > 数据湖探索 DLI > 最佳实践
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

16:10:06","user_id":"0001","user_name":"Alice","area_id":"330106"} 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

聚合函数聚合函数是从一组输入值计算一个结果。例如使用COUNT函数计算SQL查询语句返回的记录行数。聚合函数如表1所示。表1 聚合函数表函数返回值类型描述 COUNT([ ALL ] expression | DISTINCT expression1 [, expression2]*)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

聚合函数聚合函数是从一组输入值计算一个结果。例如使用COUNT函数计算SQL查询语句返回的记录行数。聚合函数如表1所示。表1 聚合函数表函数返回值类型描述 COUNT([ ALL ] expression | DISTINCT expression1 [, expression2]*)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

(p1, p2); 插入查询结果到分区 (p1 = 3, p2 = 4)中 INSERT INTO data_source_tab1 PARTITION (p1 = 3, p2 = 4) SELECT id FROM RANGE(1, 3); 插入新的查询结果到分区 (p1 =

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
find - 数据湖探索 DLI
find - 数据湖探索 DLI

find_in_set函数用于查找字符串str1在以逗号（,）分隔的字符串str2中的位置，从1开始计数。命令格式 find_in_set(string <str1>, string <str2>) 参数说明表1 参数说明参数是否必选参数类型说明 str1 是 STRING 待查找的字符串。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

"user_name": "name11"} {"product_id": "product_id_12", "user_name": "name12"} 查看print结果表数据。 +I[product_id_11, name11, product_name_11, 1.2345, 100, 50

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 798

上一页
1
...
28
29
30
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

列别名 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

HAVING - 数据湖探索 DLI

SQL作业访问报错：File not Found - 数据湖探索 DLI

Delta清理和优化 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

first - 数据湖探索 DLI

last - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

find - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线