搜索_华为云

FROM - 数据湖探索 DLI
FROM - 数据湖探索 DLI

DISTINCT：从结果集移除重复的行。注意事项所要查询的表必须是已经存在的表，否则会出错。 FROM嵌套子查询中，子查询必须要取别名，且别名的命名要早于别名的使用，否则会出错。建议别名不要重名。 FROM后所跟的子查询结果必须带上前面所取的别名，否则会出错。示例返回选了

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

按扫描量计费按扫描量计费即：按运行查询作业扫描的数据量付费，如果扫描字节数量少于10M，按10M计算。且数据定义语言（DDL）语句（如 CREATE、ALTER、DROP TABLE等语句）、管理分区语句、失败的查询语句无需付费。对于取消的查询，按取消查询时扫描的总数据量计费。扫描量计费模式

 帮助中心 > 数据湖探索 DLI > 计费说明
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left jo

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
数据类型介绍 - 数据湖探索 DLI

ng，binary，varbinary，timestamp，date，char，array，row，map，struct。其余的类型在数据查询和运算时支持。通常情况下，大部分非复合数据类型都可以通过字面量加字符串的方式来输入，示例为添加了一个json格式的字符串： select

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

(p1, p2); 插入查询结果到分区 (p1 = 3, p2 = 4)中 INSERT INTO data_source_tab1 PARTITION (p1 = 3, p2 = 4) SELECT id FROM RANGE(1, 3); 插入新的查询结果到分区 (p1 =

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
DLI内置依赖包 - 数据湖探索 DLI

15相关依赖包信息：查看Flink日志。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击作业名称，选择“运行日志”。控制台只展示最新的运行日志，更多日志信息请查看保存日志的OBS桶。在日志中搜索依赖包信息。在日志中搜索“Classpath:”即可查看相关依赖包信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

Spark增量读取Hudi参数规范规则增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例以SQL作业为例：配置参数 hoodie.tableName.consume.mode=INCREMENTAL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
WITH - 数据湖探索 DLI
WITH - 数据湖探索 DLI

WITH WITH子句定义查询子句的命名关系，可以展平嵌套查询或简化子查询语句。例如下面的查询语句是等价的： SELECT name, maxprice FROM (SELECT mame, MAX(price) AS maxprice FROM fruit GROUP BY name)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
使用DataSource语法创建OBS表 - 数据湖探索 DLI

性能文件系统，提供毫秒级别访问时延，TB/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时不会统计大小。添加数据时会修改大小至0。如需查看表大小可以通过OBS查看。 CTAS建表语句不能指定表的属性。 OBS目录下包含子目录的场景：创建表时，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
ClickHouse结果表 - 数据湖探索 DLI

DLI将Flink作业数据输出到ClickHouse中。 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。详细请参考ClickHouse组件操作。前提条件该场景需要与C

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

功能描述 Spark为了提高性能会缓存Parquet的元数据信息。当更新了Parquet表时，缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据作业执行报错，报错信息参考如下： DLI.0002: FileNotFoundException: getFileStatus

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
ClickHouse结果表 - 数据湖探索 DLI

DLI支持将Flink作业数据输出到ClickHouse数据库中。ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。详细请参考ClickHouse组件操作。前提条件该场景需要与C

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DLI对接LakeFormation - 数据湖探索 DLI

服务。操作流程图1 操作流程约束限制在表1中提供了支持对接LakeFormation获取元数据的队列和引擎类型。查看队列的引擎类型和版本请参考查看队列的基本信息。表1 LakeFormation获取元数据的队列和引擎类型队列类型引擎类型和支持的版本 default队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

DLI支持将Flink作业数据输出到ClickHouse数据库中，表类型仅支持结果表。 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。详细请参考ClickHouse组件操作。表1 支持类别类别详情

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
权限管理概述 - 数据湖探索 DLI

用户行为分析，辅助决策。如图1所示，“基础平台组组长”在华为云上申请了一个“租户管理员”（Tenant Administrator）账号，用于管理和使用华为云的各个服务。因为“大数据平台组”需要使用DLI进行数据分析，所有“基础平台组组长”增加了一个权限为“DLI服务管理员”（DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

s，才可以确保作业任务的正常执行。本节操作介绍查看弹性资源池计算资源使用情况、作业所需CU数的查看方法。怎样查看弹性资源池的资源使用情况？登录DLI管理管理控制台。选择“资源管理 > 弹性资源池”。在弹性资源池的列表页查看资源池的“实际CUs”和“已使用CUs”。实际

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
配置DLI作业桶 - 数据湖探索 DLI

OBS桶需要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。操作步骤在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
查看指定表所有分区 - 数据湖探索 DLI

以不包含所有的字段，会显示匹配上的所有分区信息。注意事项所要查看分区的表必须存在且是分区表，否则会出错。示例查看student表下面的所有的分区。 1 SHOW PARTITIONS student; 查看student表中dt='2010-10-10'的分区。 1 SHOW

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE 命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.f

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
创建Bucket索引表调优 - 数据湖探索 DLI

最近一个月最大数据量分区数据总条数 = 入湖前咨询产品线单条数据大小 = 平均 1KB（华为建议通过select * from tablename limit 100，得出100条数据的大小，再除以100得到单条平均大小）单分区数据量大小(G) = 最近一个月最大数据量分区数据

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例

总条数： 717

上一页
1
...
5
6
7
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

FROM - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

数据类型介绍 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

WITH - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线