搜索_华为云

如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Spark SQL语法概览 - 数据湖探索 DLI

查看建表语句查看表属性查看指定表所有列查看指定表所有分区查看表统计信息修改表相关语法添加列分区表相关语法添加分区（只支持OBS表）重命名分区删除分区修改表分区位置（只支持OBS表）更新表分区信息（只支持OBS表）导入数据相关语法导入数据插入数据相关语法

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
终端节点 - 数据湖探索 DLI
终端节点 - 数据湖探索 DLI

终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
删除数据库（废弃） - 数据湖探索 DLI

"job_type": "DDL", "job_mode": "async" } 如果通过异步方式删除数据库，可以通过查询作业状态接口查看当前作业的状态，详细介绍参见查询作业状态。如果强制删除数据库cascade=true，则会级联删除该数据库下面的所有表，需要谨慎使用。状态码状态码如表4所示。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
获取指定集群信息（废弃） - 数据湖探索 DLI

获取指定集群信息（废弃）功能介绍该API用于查询指定集群的信息，包括名称、描述以及绑定的计算资源数。当前接口已废弃，不推荐使用。 URI URI格式： GET /v2.0/{project_id}/clusters/{cluster_name} 参数说明表1 URI参数名称

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
UNION - 数据湖探索 DLI
UNION - 数据湖探索 DLI

ECT，EXCEPT）加括号，否则会出错。示例返回“SELECT * FROM student _1”查询结果与“SELECT * FROM student _2”查询结果的并集，不包含重复记录。 1 SELECT * FROM student_1 UNION SELECT *

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
ORDER BY - 数据湖探索 DLI
ORDER BY - 数据湖探索 DLI

ORDER BY 功能描述按字段实现查询结果的全局排序。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference ORDER BY col_name [ASC | DESC] [,col_name [ASC | DESC]

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

join 所指定的表在顺序执行中不会产生不支持的 cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

join 所指定的表在顺序执行中不会产生不支持的 cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
GROUP BY中使用HAVING - 数据湖探索 DLI

单字段，多字段，也可以是聚合函数，字符串函数等。注意事项所要分组的表必须是已经存在的表，否则会出错。如果过滤条件受GROUP BY的查询结果影响，则不能用WHERE子句进行过滤，而要用HAVING子句进行过滤。HAVING与GROUP BY合用，先通过GROUP BY进行分

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
转换函数 - 数据湖探索 DLI
转换函数 - 数据湖探索 DLI

转换函数 cast转换函数 HetuEngine会将数字和字符值隐式转换成正确的类型。HetuEngine不会把字符和数字类型相互转换。例如，一个查询期望得到一个varchar类型的值，HetuEngine不会自动将bigint类型的值转换为varchar类型。如果有必要，可以将值显式转换为指定类型。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

设置写入方式 Hudi通过hoodie.datasource.write.operation参数设置写入模式。 insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
创建并提交SQL作业 - 数据湖探索 DLI

创建并提交SQL作业场景描述本章节指导用户通过API提交SQL作业创建数据库和表，并查询数据。涉及接口创建弹性资源池创建队列提交SQL作业（推荐）操作步骤创建弹性资源池elastic_pool_dli 接口相关信息 URI格式：POST /v3/{project_

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

join 所指定的表在顺序执行中不会产生不支持的 cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

事务日志来跟踪这些文件，并通过读取所有 Parquet 文件的页脚来自动推断数据架构。转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。如果提供表名，则元存储也将更新，以反映该表现在是 Delta 表。注意事项分区表转换需要设置参数spark.sql.force

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
使用CTS审计DLI服务 - 数据湖探索 DLI

使用CTS审计DLI服务通过云审计服务，您可以记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。表1 云审计服务支持的DLI操作列表操作名称资源类型事件名称创建数据库 database createDatabase 删除数据库 database deleteDatabase

帮助中心 > 数据湖探索 DLI > 用户指南
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

DLI支持原生Spark的DataSource能力，并在其基础上进行了扩展，能够通过SQL语句或者Spark作业访问其他数据存储服务并导入、查询、分析处理其中的数据，目前支持的DLI跨源访问服务有：表格存储服务CloudTable，云搜索服务CSS，分布式缓存服务DCS，文档数据库

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
CREATE TABLE语句 - 数据湖探索 DLI

语法生成的虚拟列。它由使用同一表中其他列的非查询表达式生成，并且不会在表中进行物理存储。例如，一个计算列可以使用 cost AS price * quantity 进行定义，这个表达式可以包含物理列、常量、函数或变量的任意组合，但这个表达式不能存在任何子查询。在 Flink 中计算列一般用于为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
提交SQL作业（废弃） - 数据湖探索 DLI

据（废弃）的功能一致，区别仅在于实现方式不同。另外，用户可使用其他API来对作业进行查询和管理。具体操作有：查询作业状态查询作业详细信息查询作业结果-方式一（废弃）导出查询结果查询所有作业取消作业（废弃）该API当响应消息中“job_type”为“DCL”时，为同步操作。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
调用说明 - 数据湖探索 DLI
调用说明 - 数据湖探索 DLI

API中除特殊说明外，通常为同步操作，即响应消息中的“is_success”为请求是否执行成功。若API为异步操作，可根据响应消息中的“job_id”，执行查询作业状态API，从而获取该异步操作API最终是否执行成功。同时数据湖探索还提供多种编程语言的SDK供您使用，SDK的使用方法请参见华为云开发工具包（SDK）。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读

总条数： 702

上一页
1
...
9
10
11
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何合并小文件 - 数据湖探索 DLI

Spark SQL语法概览 - 数据湖探索 DLI

终端节点 - 数据湖探索 DLI

删除数据库（废弃） - 数据湖探索 DLI

获取指定集群信息（废弃） - 数据湖探索 DLI

UNION - 数据湖探索 DLI

ORDER BY - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

GROUP BY中使用HAVING - 数据湖探索 DLI

转换函数 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

调用说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线