搜索_华为云

去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

去重功能描述对在列的集合内重复的行进行删除，只保留第一行或最后一行数据。语法格式 SELECT [column_list] FROM ( SELECT [column_list], ROW_NUMBER() OVER ([PARTITION BY col1[

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

去重功能描述对在列的集合内重复的行进行删除，只保留第一行或最后一行数据。语法格式 SELECT [column_list] FROM ( SELECT [column_list], ROW_NUMBER() OVER ([PARTITION BY col1[

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
OFFSET - 数据湖探索 DLI
OFFSET - 数据湖探索 DLI

OFFSET OFFSET OFFSET的作用是丢弃结果集中的前若干行数据。 OFFSET count [ ROW | ROWS ] 如果有ORDER BY，则OFFSET将会作用于排序后的结果集，OFFSET丢弃前若干行数据后保留的数据集，仍然是排序的： SELECT name

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

TABLESAMPLE 有BERNOULLI和SYSTEM两种采样方法。这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

CLEAN 命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
CLUSTER BY - 数据湖探索 DLI
CLUSTER BY - 数据湖探索 DLI

CLUSTER BY 功能描述按字段实现表的分桶及桶内排序。语法格式 1 2 SELECT attr_expr_list FROM table_reference CLUSTER BY col_name [,col_name ,...]; 关键字 CLUSTER BY：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
查看计划 - 数据湖探索 DLI
查看计划 - 数据湖探索 DLI

查看计划功能描述执行该语句将返回该SQL语句的逻辑计划与物理执行计划。语法格式 1 EXPLAIN [EXTENDED | CODEGEN] statement; 关键字 EXTENDED：指定该关键字后，会同时输出逻辑计划与物理执行计划。 CODEGEN：指定该关键字后

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理运行Spark作业，作业运行失败，作业日志中提示No respond错误问题现象运行Spark作业，作业运行失败，作业日志中提示No respond错误解决方案重新创建Spark作业，创建作业时需要在“Spark参数（--conf）”中添加配置：“spark.sql

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
TRUNCATE TABLE - 数据湖探索 DLI
TRUNCATE TABLE - 数据湖探索 DLI

TRUNCATE TABLE 语法 TRUNCATE TABLE table_name 描述从表或分区中移除所有行。当表属性“auto.purge”采用默认值“false”时，被删除的数据行将保存到文件系统的回收站，否则，当“auto.purge”设置为“true”时，数据行将被直接删除。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

数据湖队列什么情况下是空闲状态？队列空闲状态是指在DLI 作业管理中，该队列下均无SQL 作业运行，或者 Flink 作业运行、Spark 作业运行。即一个自然小时内无作业运行，该自然小时为空闲状态。不会进行计费。通常按需计费的队列，在空闲1h后计算资源会被释放，再次使用时

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
OrderBy & Limit - 数据湖探索 DLI
OrderBy & Limit - 数据湖探索 DLI

OrderBy & Limit OrderBy 功能描述主要根据时间属性按照升序进行排序注意事项目前仅支持根据时间属性进行排序示例对订单根据订单时间进行升序排序 SELECT * FROM Orders ORDER BY orderTime; Limit 功能描述限制返回的数据结果个数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

UNION | INTERSECT | EXCEPT UNION、INTERSECT和EXCEPT都是集合操作。都用来将多个SELECT语句的结果集合并成单个结果集。 UNION UNION将第一个查询的结果集中的所有行与第二个查询的结果集中的行合并。 query UNION [ALL

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

MERGE INTO 命令功能通过MERGE INTO命令，根据一张表或子查询的连接条件对另外一张表进行查询，连接条件匹配上的进行UPDATE或DELETE，无法匹配的执行INSERT。这个语法仅需要一次全表扫描就完成了全部同步工作，执行效率要高于INSERT＋UPDATE。命令格式

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
查询作业结果-方式二（废弃） - 数据湖探索 DLI

查询作业结果-方式二（废弃）功能介绍该API用于在执行SQL查询语句的作业完成后，查看该作业执行的结果。目前仅支持查看“QUERY”类型作业的执行结果。该API只能查看前1000条的结果记录，若要查看全部的结果记录，需要先导出查询结果再进行查看，详细请参见导出查询结果。当前接口已废弃，不推荐使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据操作场景 DLI完全兼容开源的Apache Spark，支持用户开发应用程序代码来进行作业数据的导入、查询以及分析处理。本示例从编写Spark程序代码读取和查询OBS数据、编译打包到提交Spark Jar作业等完整的操作步骤说明来帮助您在DLI上进行作业开发。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
查询作业结果-方式一（废弃） - 数据湖探索 DLI

查询作业结果-方式一（废弃）功能介绍该API用于在执行SQL查询语句的作业完成后，查看该作业执行的结果。目前仅支持查看“QUERY”类型作业的执行结果。当前接口已废弃，不推荐使用。该API只能查看前1000条的结果记录，若要查看全部的结果记录，需要先导出查询结果再进行查看，详细请参见导出查询结果。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
Flink Jar作业开发基础样例 - 数据湖探索 DLI

Flink Jar作业开发基础样例概述用户可以基于Flink的API进行二次开发，构建自己的应用Jar包，提交到DLI队列运行，实现与MRS Kafka、HBase、Hive、HDFS，DWS，DCS等数据源的交互。本章节以通过自定义作业与MRS进行交互为例进行说明。更多样例代码请通过DLI样例代码获取。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
变更普通队列规格 - 数据湖探索 DLI

变更普通队列规格前提条件新创建的包年包月计费队列需要运行作业后才可进行规格变更。本节操作仅适用于普通队列，不适用于弹性资源池队列。注意事项目前只支持64CUs以上规格包年包月队列进行规格变更。如果在“规格变更”页面提示“Status of queue xxx is assigning

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理问题1：运行Spark作业，作业运行失败，作业日志中提示java server connection或container启动失败问题现象运行Spark作业，作业运行失败，作业日志中提示java server connection或container启动失败。解决方案

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase

总条数： 909

上一页
1
...
4
5
6
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

去重 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

OFFSET - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

CLUSTER BY - 数据湖探索 DLI

查看计划 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

TRUNCATE TABLE - 数据湖探索 DLI

数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

OrderBy & Limit - 数据湖探索 DLI

UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

如何合并小文件 - 数据湖探索 DLI

MERGE INTO - 数据湖探索 DLI

查询作业结果-方式二（废弃） - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

查询作业结果-方式一（废弃） - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

变更普通队列规格 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线