搜索_华为云

窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

GROUPING SETS 的每个子列表可以是空的，多列或表达式，它们的解释方式和直接使用 GROUP BY 子句是一样的。一个空的 Grouping Sets 表示所有行都聚合在一个分组下，即使没有数据，也会输出结果。对于 Grouping Sets 中的空子列表，结果数据中的分组或表达式列会用NULL代替。例如，上例中的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
FileSystem结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

SDK列表类型说明队列相关介绍查询所有队列的Python SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询制定资源包、删除资源包的Python SDK使用说明。 SQL作业相关介绍数据库相关、表相关、作业相关的Python SDK使用说明。 Spark作业相关

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
对象存储OBS结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

S表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建OBS的桶。具体OBS操作可以参考《对象存储服务用户指南》。本指导中的OBS桶名都为“dli-test-021”。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
JOINS - 数据湖探索 DLI
JOINS - 数据湖探索 DLI

JOIN返回符合查询条件的行的同时也返回不符合的行，分为以下三类：左外连接：LEFT JOIN或LEFT OUTER JOIN，表示以左表（nation）为基础返回左表所有的行及右表（region）中相匹配行的数据，若右表中没有匹配，则该行对应的右表的值为空。右外连接：RIGHT

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
创建集群（废弃） - 数据湖探索 DLI

cluster_name 是 String 新建的集群名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。 description 否 String 集群的描述信息。 cu_count 是 Integer 与集群绑定的计算单元个数，同时是计费的单元。可选择16CU，64C

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
查询所有表（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。 database_name 是查看表所在的数据库名称。 keyword 否过滤表名称的关键词。 with-detail 否是否获取表的详细信息（所有者，size等）。请求消息无请求参数。响应消息表2 响应参数参数是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 表相关API（废弃）
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

创建VPC和子网的操作指导请参考创建虚拟私有云和子网，如果需要在已有VPC上创建和使用新的子网，请参考为虚拟私有云创建新的子网。创建的VPC与使用的Kafka服务应在相同的区域。创建VPC和子网时，如无特殊需求，配置参数使用默认配置即可。创建安全组的操作指导请参考创建安

 帮助中心 > 数据湖探索 DLI > 快速入门
Spark作业使用咨询 - 数据湖探索 DLI

如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。查看Spark内置依赖包的版本请参考内置依赖包。资源包管理中的包是否能够下载? 资源包仅提供托管服务，不提供下载功能。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

当发生故障时，Debezium应用只能保证at-least-once的投递语义。即在非正常情况下，Debezium可能会投递重复的变更事件到Kafka中，当Flink从Kafka中消费的时候就会得到重复的事件。这可能会导致Flink query的运行得到错误的结果或者非预期的异常。解决方案：将作业参数 table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

b已创建的DLI数据源连接。资源队列选择已创建的DLI SQL类型的队列。数据库名称选择DLI下已创建的数据库。当前示例为在DLI上创建数据库和表中创建的数据库名，即为“testdb”。表名选择DLI下已创建的表名。当前示例为在DLI上创建数据库和表中创建的表名，即为“tablecss”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
比较函数和运算符 - 数据湖探索 DLI

IS DISTINCT FROM和IS NOT DISTINCT FROM 特有用法。在HetuEngine的SQL中，NULL代表未知值，所有与NULL有关的比较，产生的结果也是NULL。IS DISTINCT FROM和IS NOT DISTINCT FROM可以把null值

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
字符串函数概览 - 数据湖探索 DLI

次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定字符串replace_string后，返回结果字符适用于Spark3.3.1：用于将source字符串中第occurrence次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
CREATE TABLE语句 - 数据湖探索 DLI

Epoch 以来的经过的时间。返回的 watermark 只有当其不为空且其值大于之前发出的本地 watermark 时才会被发出（以保证 watermark 递增）。每条记录的 watermark 生成表达式计算都会由框架完成。框架会定期发出所生成的最大的 watermark

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
DWS结果表（不推荐使用） - 数据湖探索 DLI

在sink算子前是否按指定的主键进行分区。该参数旨在解决多并发写入的场景下且write.mode为upsert时，如果多个子任务中写入sink的一批数据具有不止一条相同的主键，并且主键相同的这些数据先后顺序不一致，就会导致两个子任务在向DWS根据主键获取行锁时发生互锁的问题。示例该示

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI队列时队列类型需要选择为“SQL队列”。已创建包含Kafka组件的MRS安全集群。具体创建MRS集群的操作可以参考创建MRS集群。本示例创建的MRS集群版本为：MRS 3.1.0。本示例创建的MRS集群开启了Kerberos认证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

参考增强型跨源连接，在DLI上根据DWS和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据DWS和Kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明本样例只适用于MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase

总条数： 220

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

窗口聚合 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

Print - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

JOINS - 数据湖探索 DLI

创建集群（废弃） - 数据湖探索 DLI

查询所有表（废弃） - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

比较函数和运算符 - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线