搜索_华为云

如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Spark作业相关API - 数据湖探索 DLI

Spark作业相关API 创建批处理作业查询批处理作业列表查询批处理作业详情查询批处理作业状态取消批处理作业

 帮助中心 > 数据湖探索 DLI > API参考
attrs - 数据湖探索 DLI
attrs - 数据湖探索 DLI

attrs_value_set_expr 格式说明语法描述 attrs_value_set_expr 属性值集合。 sub_query 子查询语句。 ( 指定子查询表达式开始。 ) 指定子查询表达式结束。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
Json函数和运算符 - 数据湖探索 DLI

3 get_json_object(string json,string json_path)；按照json_path格式抓取json中的信息 SELECT get_json_object('{"id": 1, "value":"xxx"}', '$.value'); -- "xxx"

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
终端节点 - 数据湖探索 DLI
终端节点 - 数据湖探索 DLI

终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

如果队列名称已存在，单击“提交”时，系统会提示“Queue xxx already exists”错误，可返回“上一步”进行修改。队列创建成功后，您可以在“队列管理”页面查看和选择使用对应的队列。新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。父主题：创建弹性资源池和队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询指定资源包、删除资源包的Java SDK使用说明。 SQL作业相关介绍数据库相关、表相关、作业相关Java

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
ORDER BY - 数据湖探索 DLI
ORDER BY - 数据湖探索 DLI

ORDER BY 功能描述按字段实现查询结果的全局排序。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference ORDER BY col_name [ASC | DESC] [,col_name [ASC | DESC]

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
UNION - 数据湖探索 DLI
UNION - 数据湖探索 DLI

ECT，EXCEPT）加括号，否则会出错。示例返回“SELECT * FROM student _1”查询结果与“SELECT * FROM student _2”查询结果的并集，不包含重复记录。 1 SELECT * FROM student_1 UNION SELECT *

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

join 所指定的表在顺序执行中不会产生不支持的 cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

join 所指定的表在顺序执行中不会产生不支持的 cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
SQL作业相关API（废弃） - 数据湖探索 DLI

SQL作业相关API（废弃）提交SQL作业（废弃）取消作业（废弃）查询作业结果-方式一（废弃）查询作业结果-方式二（废弃）父主题：历史API

帮助中心 > 数据湖探索 DLI > API参考 > 历史API
DLI权限管理类 - 数据湖探索 DLI

更新程序包时提示权限不足怎么办？执行SQL查询语句报错：DLI.0003: Permission denied for resource.... 已经给表授权，但是提示无法查询怎么办？表继承数据库权限后，对表重复赋予已继承的权限会报错吗？为什么已有View视图的select权限，但是查询不了View？提交作业时提示作业桶权限不足怎么办？

帮助中心 > 数据湖探索 DLI > 常见问题
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

join 所指定的表在顺序执行中不会产生不支持的 cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
DLI数据库和表类 - 数据湖探索 DLI

DLI数据库和表类为什么在DLI控制台中查询不到表？ OBS表压缩率较高怎么办？字符码不一致导致数据乱码怎么办？删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？创建OBS外表，

帮助中心 > 数据湖探索 DLI > 常见问题
GROUP BY中使用HAVING - 数据湖探索 DLI

单字段，多字段，也可以是聚合函数，字符串函数等。注意事项所要分组的表必须是已经存在的表，否则会出错。如果过滤条件受GROUP BY的查询结果影响，则不能用WHERE子句进行过滤，而要用HAVING子句进行过滤。HAVING与GROUP BY合用，先通过GROUP BY进行分

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
转换函数 - 数据湖探索 DLI
转换函数 - 数据湖探索 DLI

转换函数 cast转换函数 HetuEngine会将数字和字符值隐式转换成正确的类型。HetuEngine不会把字符和数字类型相互转换。例如，一个查询期望得到一个varchar类型的值，HetuEngine不会自动将bigint类型的值转换为varchar类型。如果有必要，可以将值显式转换为指定类型。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

设置写入方式 Hudi通过hoodie.datasource.write.operation参数设置写入模式。 insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

DLI支持原生Spark的DataSource能力，并在其基础上进行了扩展，能够通过SQL语句或者Spark作业访问其他数据存储服务并导入、查询、分析处理其中的数据，目前支持的DLI跨源访问服务有：表格存储服务CloudTable，云搜索服务CSS，分布式缓存服务DCS，文档数据库

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
分组资源相关API（废弃） - 数据湖探索 DLI

分组资源相关API（废弃）上传分组资源（废弃）查询分组资源列表（废弃）上传jar类型分组资源（废弃）上传pyfile类型分组资源（废弃）上传file类型分组资源（废弃）查询组内资源包（废弃）删除组内资源包（废弃）修改组或资源包拥有者（废弃）父主题：历史API

帮助中心 > 数据湖探索 DLI > API参考 > 历史API

总条数： 920

上一页
1
...
40
41
42
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何合并小文件 - 数据湖探索 DLI

Spark作业相关API - 数据湖探索 DLI

attrs - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

终端节点 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

ORDER BY - 数据湖探索 DLI

UNION - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

SQL作业相关API（废弃） - 数据湖探索 DLI

DLI权限管理类 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

DLI数据库和表类 - 数据湖探索 DLI

GROUP BY中使用HAVING - 数据湖探索 DLI

转换函数 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

分组资源相关API（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线