搜索_华为云

比较函数 - 数据湖探索 DLI
比较函数 - 数据湖探索 DLI

和分组操作中可以被重写的操作。对于流式查询，该操作在 join 和分组操作中被重写。根据输入行的数量计算查询结果所需的状态可能会无限增长。请提供具有有效保留间隔的查询配置，以防止状态过大。 value IN (sub-query) BOOLEAN 如果 value 等于子查询结果集中的一行则返回

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

Zookeeper中的根目录，默认是/hbase connector.write.buffer-flush.max-size 否每次插入的数据的最大的缓存大小，默认为2mb ,仅支持mb connector.write.buffer-flush.max-rows 否每次刷新数据的最大条数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

否 Zookeeper中的根目录，默认是/hbase connector.rowkey 否读取复合rowkey的内容，并根据设置的大小，赋给新的字段形如：rowkey1:3,rowkey2:3,… 其中3表示取该字段的前3个byte，该值不能大于该字段的字节大小，且该值不能小于

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
pyspark样例代码 - 数据湖探索 DLI

前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。通过DataFrame API 访问 import相关依赖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

Zookeeper中的根目录，默认是/hbase connector.write.buffer-flush.max-size 否每次插入的数据的最大的缓存大小，默认为2mb ,仅支持mb connector.write.buffer-flush.max-rows 否每次刷新数据的最大条数

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scan.count 每批次读取的数据记录数，默认为100。如果在读取过程中，redis集群中的CPU使用率还有提升空间，可以调大该参数。 iterator.grouping.size 每批次插入的数据记录数，默认为100。如果在插入过程中，redis集群中的CPU使用率还有提升空间，可以调大该参数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
SDK的获取与安装 - 数据湖探索 DLI

发环境的项目。具体操作请参考方法二：通过在Eclipse中导入JAR文件安装SDK。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。表1 目录结构名称说明 jars SDK及其依赖的jar包。 maven-install

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

他服务的操作权限。 CU数量 CU数量为DLI的计算单元数量和管理单元数量总和，CU也是DLI的计费单位，1CU=1核4G。当前配置的CU数量为运行作业时所需的CU数，不能超过其绑定队列的CU数量。管理单元管理单元CU数量。并行数作业的并行数是指作业中各个算子的并行执行

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
批作业SQL常用配置项说明 - 数据湖探索 DLI

要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
使用DataSource语法创建OBS表 - 数据湖探索 DLI

CTAS建表语句不能指定表的属性。 OBS目录下包含子目录的场景：创建表时，若指定路径为OBS上的目录，且该目录下包含子目录（或嵌套子目录），则子目录下的所有文件类型及其内容也是表内容。您需要保证所指定的目录及其子目录下所有文件类型和建表语句中指定的存储格式一致，所有文件内容和表中的字段一致，否则查询将报错。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 创建OBS表
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
使用DataSource语法创建OBS表 - 数据湖探索 DLI

CTAS建表语句不能指定表的属性。 OBS目录下包含子目录的场景：创建表时，若指定路径为OBS上的目录，且该目录下包含子目录（或嵌套子目录），则子目录下的所有文件类型及其内容也是表内容。您需要保证所指定的目录及其子目录下所有文件类型和建表语句中指定的存储格式一致，所有文件内容和表中的字段一致，否则查询将报错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
创建Redis表 - 数据湖探索 DLI
创建Redis表 - 数据湖探索 DLI

key属性的列名。 hash_key_column 否当value_type设置为hash时，需要指定本字段作为第二级key属性的列名。 cache_max_num 否表示最大缓存的查询结果数，默认值为32768。 cache_time 否表示数据库查询结果在内存中缓存的最大时

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建维表
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
创建集群（废弃） - 数据湖探索 DLI

cluster_name 是 String 新建的集群名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。 description 否 String 集群的描述信息。 cu_count 是 Integer 与集群绑定的计算单元个数，同时是计费的单元。可选择16CU，64C

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
创建CSS类型跨源认证 - 数据湖探索 DLI

安全集群的登录密码。 Certificate路径上传“安全证书”的OBS路径。即步骤2的OBS桶地址。图1 创建认证信息-CSS 访问CSS的表。跨源认证创建成功后，在创建访问CSS的表时只需关联跨源认证即可安全访问数据源。例如在使用Spark SQL来创建访问CSS的表时使用es

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
常见场景的委托权限策略 - 数据湖探索 DLI

常见场景的委托权限策略本节操作提供了DLI常见场景的委托权限策略，用于用户自定义权限时配置委托的权限策略。委托策略中的“Resource”根据需要具体情况进行替换。数据清理委托权限配置适用场景：数据清理委托，表生命周期清理数据及lakehouse表数据清理使用。该委托需新建

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
OBS输入流 - 数据湖探索 DLI
OBS输入流 - 数据湖探索 DLI

取用户存储的数据，作为作业的输入数据。适用于大数据分析、原生云应用程序数据、静态网站托管、备份/活跃归档、深度/冷归档等场景。对象存储服务（Object Storage Service，简称OBS）是一个基于对象的海量存储服务，为客户提供海量、安全、高可靠、低成本的数据存储能力

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化，参考队列相关完成队列创建等操作。新建SQL作业 DLI提供新建Flink SQL作业的接口。您可以使用该接口新建Flink SQL作业并提交到DLI，示例代码如下： 1 2

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK

总条数： 471

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

比较函数 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

批作业SQL常用配置项说明 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

创建Redis表 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

创建集群（废弃） - 数据湖探索 DLI

创建CSS类型跨源认证 - 数据湖探索 DLI

常见场景的委托权限策略 - 数据湖探索 DLI

OBS输入流 - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线