搜索_华为云

产品公告 - 数据湖探索 DLI
产品公告 - 数据湖探索 DLI

1版本停止服务（EOS）公告 DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 DLI经典型跨源连接下线（EOL）公告 DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 DLI Spark 2.3.2版本停止服务（EOS）公告

 帮助中心 > 数据湖探索 DLI > 服务公告
Hudi常见配置参数 - 数据湖探索 DLI

hudi.keygen.ComplexKeyGenerator 同步Hive表配置由DLI提供的元数据服务是一种Hive Metastore服务（HMS），因此下列参数与同步元数据服务相关。表2 同步Hive表参数配置参数描述默认值 hoodie.datasource.hive_sync

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

SDK简介 DLI SDK简介数据湖探索服务软件开发工具包（DLI SDK，Data Lake Insight Software Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI

帮助中心 > 数据湖探索 DLI > SDK参考
查询批处理作业日志（废弃） - 数据湖探索 DLI

"具体的作业日志信息" ] } 状态码状态码如表4所示。表4 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： Spark批处理相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > Spark批处理相关API（废弃）
查询组内资源包（废弃） - 数据湖探索 DLI

ist.tar.gz" } 状态码状态码如表4所示。表4 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：分组资源相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
SHOW VIEWS - 数据湖探索 DLI
SHOW VIEWS - 数据湖探索 DLI

[ESCAPE escapeChar] ] 描述列举指定Schema中所有满足条件的视图。默认使用当前Schema，也可以通过in/from子句来指定Schema。通过可选子句“LIKE”，筛选视图名满足规则运算表达式的视图，如果不使用这个子句，会列举所有视图。匹配的视图会按字母顺序排列。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

3.x：通过 `CREATE TABLE ... TBLPROPERTIES`和`ALTER TABLE ... SET TBLPROPERTIES`指定external属性，命令将会失败。如需在Spark3.3.x版本中恢复Spark2.4.x的使用方式，可以通过设置spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

区域，可减少网络时延，提高访问速度。项目每个区域默认对应一个项目，这个项目由系统预置。套餐包类型弹性资源池CU时套餐包：按照“CU时”收取计算费用，用户在弹性资源池添加的队列上运行作业时按照弹性资源池CU时计费。扫描数据量套餐包：按照用户每个作业的数据扫描量（单位为“GB”）收取计算费用。

帮助中心 > 数据湖探索 DLI > 计费说明
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，性能较好。通常，窗口去重直接用于窗口表值函数上。另外，它可以用于基于窗口表值函数的操作。比如窗口聚合，窗口TopN和窗口关联。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

由于Flink Checkpoint和Savepoint生成机制及格式一致，因此可以通过Flink作业列表“操作”列中的“更多 > 导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。登录DLI管理控制台，选择“作业管理 > Flink作业”。在对应Flink作业所在行，选择“操作

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
队列标签管理 - 数据湖探索 DLI

在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预先在标签管理服务中创建好预定义标签，然后在“标签键”的下拉框中进行选择。用户可以通过单击“查看预定义标签”进入标签管理服务的“预定义标签”页面，然后单击“创建标签”来创建新的预定义标签。具体请参见《标签管理服务用户指南》中的“创建预定义标签”章节。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
右外连接 - 数据湖探索 DLI
右外连接 - 数据湖探索 DLI

RIGHT OUTER JOIN：返回右表的所有记录，没有匹配值的记录将返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例右外连接和左外连接相似，但是会将右边表（这里的course_info)中的所有记录返回，没有匹配值的左表记录将返回NULL。 1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
全外连接 - 数据湖探索 DLI
全外连接 - 数据湖探索 DLI

OUTER JOIN：根据左表与右表的所有记录进行匹配，没有匹配值的记录返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例利用全外连接可以将两张表中的所有记录返回，没有匹配值的左表及右表记录将返回NULL。 1 2 SELECT student_info

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
左外连接 - 数据湖探索 DLI
左外连接 - 数据湖探索 DLI

LEFT OUTER JOIN：返回左表的所有记录，没有匹配值的记录将返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例左外连接时利用student_info表中的courseId与course_info中的courseId进行匹配，返回已

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
笛卡尔连接 - 数据湖探索 DLI
笛卡尔连接 - 数据湖探索 DLI

join_condition：连接条件，如果该条件恒成立（比如1=1)，该连接就是笛卡尔连接。所以，笛卡尔连接输出的记录条数等于被连接表的各记录条数的乘积，若需要进行笛卡尔积连接，需使用专门的关键词CROSS JOIN。CROSS JOIN是求笛卡尔积的标准方式。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
在Spark SQL作业中使用UDF - 数据湖探索 DLI

自建的SQL队列。跨账号使用UDF时，除了创建UDF函数的用户，其他用户如果需要使用时，需要先进行授权才可使用对应的UDF函数。授权操作参考如下：登录DLI管理控制台，选择“ 数据管理 > 程序包管理”页面，选择对应的UDF Jar包，单击“操作”列中的“权限管理”，进入权限

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hive方言 - 数据湖探索 DLI
Hive方言 - 数据湖探索 DLI

Hive方言简介从Flink 1.11.0 开始，在使用Hive方言时，Flink允许用户用Hive语法来编写SQL语句。通过提供与Hive语法的兼容性，改善与Hive的互操作性，并减少用户需要在Flink和Hive之间切换来执行不同语句的情况。详情可参考：Apache Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
使用Hive语法创建OBS表 - 数据湖探索 DLI

推荐使用OBS并行文件系统进行存储。并行文件系统是一种高性能文件系统，提供毫秒级别访问时延，TB/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时会统计大小。添加数据时不会修改大小。如需查看表大小可以通过OBS查看。 CTAS建表语句不能指定表的属性。关于分区表的使用说明：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

写入Flink SQL （不使用Catalog的场景）：这里的sink表通过创建临时表指向Hudi表路径来写入数据，同时在表参数中配置hive_sync相关参数，实时同步元数据至由DLI提供的元数据服务。（具体参数详见Flink参数一节）请将作业中sink表的path参数修改为希望保存hudi表的obs路径。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

例如：假设指定了一个 5 分钟的滚动窗口。Flink 将每 5 分钟生成一个新的窗口。图1 滚动窗口示例图语法描述 TUMBLE 函数通过时间属性字段为每行数据分配一个窗口。在流计算模式，时间属性字段必须被指定为事件或处理时间属性。在批计算模式，窗口表函数的时间属性字段必须是

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口

总条数： 1133

上一页
1
...
25
26
27
...
57
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

产品公告 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

查询批处理作业日志（废弃） - 数据湖探索 DLI

查询组内资源包（废弃） - 数据湖探索 DLI

SHOW VIEWS - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

队列标签管理 - 数据湖探索 DLI

右外连接 - 数据湖探索 DLI

全外连接 - 数据湖探索 DLI

左外连接 - 数据湖探索 DLI

笛卡尔连接 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

Hive方言 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线