搜索_华为云

查看计划 - 数据湖探索 DLI
查看计划 - 数据湖探索 DLI

查看计划功能描述执行该语句将返回该SQL语句的逻辑计划与物理执行计划。语法格式 1 EXPLAIN [EXTENDED | CODEGEN] statement; 关键字 EXTENDED：指定该关键字后，会同时输出逻辑计划与物理执行计划。 CODEGEN：指定该关键字后

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
预览SQL作业查询结果 - 数据湖探索 DLI

预览SQL作业查询结果功能介绍该API用于在执行SQL查询语句的作业完成后，查看该作业执行的结果。目前仅支持查看“QUERY”类型作业的执行结果。该API只能查看前1000条的结果记录，且不支持分页查询。若要查看全部的结果记录，需要先导出查询结果再进行查看，详细请参见导出查询结果。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
trans - 数据湖探索 DLI
trans - 数据湖探索 DLI

trans_array trans_array函数用于将一行数据转为多行的UDTF，将列中存储的以固定分隔符格式分隔的数组转为多行。使用限制所有作为key的列必须位于在前面，而要转置的列必须放在后面。在一个select中只能有一个UDTF，不可以再出现其他的列。不可以与group by、cluster

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
调用说明 - 数据湖探索 DLI
调用说明 - 数据湖探索 DLI

方法请参见构造请求。 DLI API中除特殊说明外，通常为同步操作，即响应消息中的“is_success”为请求是否执行成功。若API为异步操作，可根据响应消息中的“job_id”，执行查询作业状态API，从而获取该异步操作API最终是否执行成功。同时数据湖探索还提供多种编程

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

[DISTINCT] query INTERSECT仅返回第一个和第二个查询的结果相交的行。以下是最简单的INTERSECT子句之一的示例。它选择值13和42，并将此结果集与选择值13的第二个查询合并。由于42仅在第一个查询的结果集中，因此不包含在最终结果中。 SELECT * FROM (VALUES

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ Spark jar 作业一直处于“提交中”可能是队列剩余的CU量不足导致作业无法提交。查看队列的的剩余步骤如下：查看队列CU使用量。点击“云监控服务 > 云服务监控 > 数据探索湖 > 队列监控 > 队列CU使用量” 。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
UNNEST - 数据湖探索 DLI
UNNEST - 数据湖探索 DLI

T还可以与多个参数一起使用，将被展开成多列，行数与最高基数参数相同（其他列用空填充）。UNNEST可以选择使用WITH ORDINALITY子句，在这种情况下，会在末尾添加一个额外的ORDINALITY列。UNNEST通常与JOIN一起使用，可以引用JOIN左侧关系中的列。使用单独一列

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
了解数据目录、数据库和表 - 数据湖探索 DLI

化数据，由多个数据表组成，这些数据表通过键和索引相互关联。表表是数据库最重要的组成部分之一，它由行和列组成。每一行代表一个数据项，每一列代表数据的一个属性或特征。表用于组织和存储特定类型的数据，使得数据可以被有效地查询和分析。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

etastore是否存在，如果该数据库存在则会导致Spark作业执行失败。因此当Spark3.x的作业日志中如果出现一条访问catalog查询该数据库，并提示数据库不存在是为了确保Spark作业正常运行，无需执行其他操作。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
创建弹性资源池并添加队列 - 数据湖探索 DLI

示例：弹性资源池规格为192CUs，资源池中的队列执行作业占用了68CUs，计划缩容至64CUs。执行缩容任务时，系统判断剩余124CUs，按64CUs的缩容步长执行缩容任务，剩余60CUs资源无法继续缩容，因此弹性资源池执行缩容任务后规格为128CUs。创建弹性资源池在左侧导航栏单击“资源管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

编辑：重新编辑修改该作业。终止：当作业状态在“提交中”和“运行中”时，“终止”按钮才生效。当作业状态为“已成功”、“已失败”、“已取消”的作业不能终止。当“终止”按钮为灰色时，表示无法执行终止操作。重新执行：重新执行该作业。 SparkUI：单击后，将跳转至Spark任务运行情况界面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
对两个表进行join操作时，提示：SQL_ANALYSIS_ERROR: Reference 't.id' is ambiguous, could be: t.id, t.id.; - 数据湖探索 DLI

ambiguous, could be: t.id, t.id.; 出现这个提示，表示进行join操作的两个表中包含相同的字段，但是在执行命令时，没有指定该字段的归属。例如：在表tb1和tb2中都包含字段“id”。错误的命令： select id from tb1 join tb2; 正确的命令：

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

参考MRS HBase的使用，通过HBase shell在HBase中创建相应的表，表名为order，表中只有一个列簇detail。创建语句参考如下： create 'order', {NAME => 'detail'} 在HBase shell中执行下述命令，以插入一条数据： put 'order'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

shell在HBase中创建相应的表，表名为order，表中只有一个列簇detail。创建语句参考如下： create 'order', {NAME => 'detail'} 在HBase shell中执行下述命令，以插入一条数据： put 'order', '202103241000000001'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
创建SQL作业模板 - 数据湖探索 DLI

使用模板提交SQL作业执行模板操作步骤如下：在管理控制台左侧，单击“作业模板”>“SQL模板”。在“SQL模板”页面，勾选相应的模板，单击“操作”列的“执行”，将跳转至“SQL编辑器”页面，并在SQL作业编辑窗口中自动输入对应的SQL语句。在SQL作业编辑窗口右上方，单击“执行”运行SQ

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
DLI弹性资源池与队列简介 - 数据湖探索 DLI

park Task重算，引起Spark作业和SQL作业内部自动重试，当作业重试超过限制会导致作业执行失败，需用户重新执行作业。 Spark2.3版本作业需要升级作业版本后才能支持运行中动态缩容功能。 Spark Streaming作业、Flink作业在运行过程中所在节点无法缩容，

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

问题出现时Flink读取的时间和RDS数据库的时间会相差13小时。请在RDS数据库内执行如下语句 show variables like '%time_zone%' 执行结果如下：图1 执行结果表1 参数说明参数说明 system_time_zone 数据库时区。这里它指向

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

run clean on "obs://bucket/path/h1"; 注意事项对表执行clean操作时需要表的owner才可以执行。如果需要修改clean默认的参数，需要在执行SQL时，在设置中配置需要保留的commit数量等参数，参见Hudi常见配置参数。使用由DLI提供的

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的剩余可用CUs，才可以确保作业任务的正常执行。本节操

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类

总条数： 981

上一页
1
2
3
4
5
...
50
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看计划 - 数据湖探索 DLI

预览SQL作业查询结果 - 数据湖探索 DLI

trans - 数据湖探索 DLI

调用说明 - 数据湖探索 DLI

UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

UNNEST - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

对两个表进行join操作时，提示：SQL_ANALYSIS_ERROR: Reference 't.id' is ambiguous, could be: t.id, t.id.; - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线