搜索_华为云

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

Spark增量读取Hudi参数规范规则增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例以SQL作业为例：配置参数 hoodie.tableName.consume.mode=INCREMENTAL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
WITH - 数据湖探索 DLI
WITH - 数据湖探索 DLI

WITH WITH子句定义查询子句的命名关系，可以展平嵌套查询或简化子查询语句。例如下面的查询语句是等价的： SELECT name, maxprice FROM (SELECT mame, MAX(price) AS maxprice FROM fruit GROUP BY name)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

在使用join进行多表关联查询时，不管表数据量大小，join时都需要指定on条件来减少多表关联的数据量，从而减轻队列的负荷，提升查询效率。例如，问题现象中的问题语句可以根据业务场景，在join时通过指定on条件来进行优化，这样会极大减少关联查询的结果集，提升查询效率。 select

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
终端节点 - 数据湖探索 DLI
终端节点 - 数据湖探索 DLI

终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）华北-北京四 cn-north-4

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
提交SQL作业（推荐） - 数据湖探索 DLI

该参数设置为true：当子查询中数据不重复的情况下，执行关联子查询，不需要对子查询的结果去重。当子查询中数据重复的情况下，执行关联子查询，会提示异常，必须对子查询的结果做去重处理，比如max(),min()。该参数设置为false：不管子查询中数据重复与否，执行关联子查询时，都需要对子查询的结果去重，比如max()

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
执行查询语句报错：The current account does not have permission to perform this operation,the current account was restricted. - 数据湖探索 DLI

执行查询语句报错：The current account does not have permission to perform this operation,the current account was restricted. Restricted for no budget

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
基本语句 - 数据湖探索 DLI
基本语句 - 数据湖探索 DLI

出，如果不指定ALL或DISTINCT，查询结果将包含所有的行，即使是重复的行数据也将被返回。 DISTINCT 在SELECT语句中使用DISTINCT关键字时，系统会在查询结果中去除重复的数据，确保结果的唯一性。 WHERE 指定查询的过滤条件，支持算术运算符、关系运算符和逻辑运算符。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

SV数据转换为Parquet数据。方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间

 帮助中心 > 数据湖探索 DLI > 最佳实践
FROM - 数据湖探索 DLI
FROM - 数据湖探索 DLI

DISTINCT：从结果集移除重复的行。注意事项所要查询的表必须是已经存在的表，否则会出错。 FROM嵌套子查询中，子查询必须要取别名，且别名的命名要早于别名的使用，否则会出错。建议别名不要重名。 FROM后所跟的子查询结果必须带上前面所取的别名，否则会出错。示例返回选了

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
table - 数据湖探索 DLI
table - 数据湖探索 DLI

table_reference 格式无。说明表或视图的名称，仅支持字符串类型，也可为子查询，当为子查询时，必须加别名。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
sub - 数据湖探索 DLI
sub - 数据湖探索 DLI

sub_query 格式无。说明指子查询。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
测试地址连通性 - 数据湖探索 DLI

在“测试地址连通性”页面填写需要测试的地址。支持域名和IP，可指定端口。数据源地址支持以下输入格式：IPv4地址、IPv4+端口号、域名、域名+端口号。 · IPv4地址：192.168.x.x · IPv4+端口号：192.168.x.x:8080 · 域名：domain-xxxxxx.com · 域名+端口号：domain-xxxxxx

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。 description：资源包描述信息。查询所有资源包 DLI提供查询资源列表接口，您可以使用该接口并选择相应的资源来执行作业。示例代码如下： 1

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

按扫描量计费按扫描量计费即：按运行查询作业扫描的数据量付费，如果扫描字节数量少于10M，按10M计算。且数据定义语言（DDL）语句（如 CREATE、ALTER、DROP TABLE等语句）、管理分区语句、失败的查询语句无需付费。对于取消的查询，按取消查询时扫描的总数据量计费。扫描量计费模式

 帮助中心 > 数据湖探索 DLI > 计费说明
弹性资源池扩缩容历史记录 - 数据湖探索 DLI

start_time用于查询扩缩容历史的开始时间，该时间点需大于当前时间点减30天，必须小于end_time 。时间格式为unix时间戳，单位：毫秒。若start_time为空，则查询end_time前七天到end_time的数据（end_time最大不能大于当前时间30天）。查询当前时间点

 帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
select - 数据湖探索 DLI
select - 数据湖探索 DLI

select_statement 格式无。说明 SELECT基本语句，即查询语句。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
INTERSECT - 数据湖探索 DLI
INTERSECT - 数据湖探索 DLI

INTERSECT 功能描述 INTERSECT返回多个查询结果的交集。语法格式 1 select_statement INTERSECT select_statement; 关键字 INTERSECT：返回多个查询结果的交集，且每一个SELECT语句返回的列数必须相同，列的

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
Subqueries - 数据湖探索 DLI
Subqueries - 数据湖探索 DLI

region WHERE region.regionkey = nation.regionkey) IN 确定子查询生成的任意值是否等于给定的表达式。IN的结果遵循null的标准规则。子查询必须只生成一列： SELECT name FROM nation WHERE regionkey IN

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
查看增强型跨源连接的基本信息 - 数据湖探索 DLI

查看增强型跨源连接的基本信息增强型跨源连接创建完成后您可以通过管理控制台查看和管理您的增强型跨源连接。本节操作介绍在管理控制台如何查看增强型跨源连接基本信息，包括增强型跨源连接的是否支持IPv6、主机信息等。查看增强型跨源连接的基本信息登录DLI管理控制台。选择“跨源管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接

总条数： 764

上一页
1
...
4
5
6
...
39
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

WITH - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

终端节点 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

执行查询语句报错：The current account does not have permission to perform this operation,the current account was restricted. - 数据湖探索 DLI

基本语句 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

FROM - 数据湖探索 DLI

table - 数据湖探索 DLI

sub - 数据湖探索 DLI

测试地址连通性 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

弹性资源池扩缩容历史记录 - 数据湖探索 DLI

select - 数据湖探索 DLI

INTERSECT - 数据湖探索 DLI

Subqueries - 数据湖探索 DLI

查看增强型跨源连接的基本信息 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线