搜索_华为云

Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

Hive表的BATCH和STREAM。Flink可以作为Hive批处理引擎的更高效的替代方案，或者用于连续读写Hive表，以支持实时数据仓库应用程序。Apache Flink Hive Read & Write 功能描述本节介绍利用Flink来读写Hive的表。Hive源表的定义

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
LIMIT | FETCH FIRST - 数据湖探索 DLI

666.0 | 2020-11-11 (2 rows) 如果使用了OFFSET，则LIMIT或FETCH FIRST会在OFFSET之后应用于结果集： SELECT * FROM (VALUES 5, 2, 4, 1, 3) t(x) ORDER BY x OFFSET 2 FETCH

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

DLI不支持直接使用SET语句配置参数点击”设置”，随后在”参数设置”一栏可以配置键和值，Hudi的参数可以通过此处提交。配置在此处的参数会在提交SQL作业时被应用。随后可以在左侧菜单点击”作业管理”->”SQL作业”，随后在列表中选中执行的作业，并点击下方窗格，唤出作业详情，在”参数设置”一栏中，可以检查参数配置情况。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Lambda 表达式 - 数据湖探索 DLI
Lambda 表达式 - 数据湖探索 DLI

*)$',x -> upper(x[1]) || x[2] || x[3]); -- Once upon a time ... 在聚合函数中应用Lambda表达式。如使用reduce_agg()计算一个较为复杂的按列求元素和： SELECT reduce_agg(value, 0,

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

DLI完全兼容Apache Spark、Apache Flink生态和接口，是集实时分析、离线分析、交互式分析为一体的Serverless大数据计算分析服务。线下应用可无缝平滑迁移上云，减少迁移工作量。采用批流融合高扩展性框架，为TB~EB级数据提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求

 帮助中心 > 数据湖探索 DLI > 产品介绍
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

支持的Connector Kafka Filesystem 注意事项 Maxwell应用允许将每个变动消息精确地传递一次。在这种情况下，Flink在消费Maxwell生成的消息时处理得很好。如果Maxwell应用程序在at-least-once模式处理，它可能向Kafka写入重复的改动消

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
FileSystem结果表 - 数据湖探索 DLI

的随机ID值。uid不具有容错机制，所以当Subtask从故障恢复时，uid会重新生成。文件合并 FileSink 开始支持已经提交Pending文件的合并，从而允许应用设置一个较小的时间周期并且避免生成大量的小文件。这一功能开启后，在文件转为Pending状态与文件最终提交之间会进行文件合并。这些Pending状态的文件将首先被提交为一个以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
对象存储OBS结果表 - 数据湖探索 DLI

的随机ID值。uid不具有容错机制，所以当Subtask从故障恢复时，uid会重新生成。文件合并 FileSink 开始支持已经提交Pending文件的合并，从而允许应用设置一个较小的时间周期并且避免生成大量的小文件。这一功能开启后，在文件转为Pending状态与文件最终提交之间会进行文件合并。这些Pending状态的文件将首先被提交为一个以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

选择作业运行时使用的队列资源。应用程序是选择步骤1：开发Jar包并上传数据至OBS中自定义的程序包。主类是指定加载的Jar包类名。 “主类”参数用于指定Flink作业的入口，即包含main方法的类。这是Flink作业启动时首先执行的类。当应用程序类型为.jar时，必须提供主类名称。

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
状态码 - 数据湖探索 DLI
状态码 - 数据湖探索 DLI

状态码状态码如表1所示。表1 状态码状态码编码状态码说明 100 Continue 继续请求。这个临时响应用来通知客户端，它的部分请求已经被服务器接收，且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。例如，切换到HTTP的新版本协议。

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

重复的变更事件在正常的操作环境下，Debezium 应用能以exactly-once的语义投递每条变更事件。在这种情况下，Flink 消费 Debezium 产生的变更事件能够工作得很好。当发生故障时，Debezium应用只能保证at-least-once的投递语义。即在非正

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
数据保护技术 - 数据湖探索 DLI

务器将要求所有客户端使用加密连接，这可以提高通信的安全性。 true spark.authenticate 该参数用于配置是否对Spark应用程序的组件进行身份验证。启用身份验证可以防止未授权的访问。这个参数可以设置为true来启用身份验证。 true Flink作业传输通信加密

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Workshop，DEW）、云凭据管理服务（Cloud Secret Management Service，CSMS），提供一种安全、可靠、简单易用隐私数据加解密方案。用户或应用程序通过凭据管理服务，创建、检索、更新、删除凭据，轻松实现对敏感凭据的全生命周期的统一管理，有效避免程序硬编码或明文配置等问题导致的敏感信息泄露以及权限失控带来的业务风险。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

Configurations”界面，勾选：include dependencies with "Provided" scope。单击“OK”完成应用配置。使用方式将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
在Spark SQL作业中使用UDF - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDF函数开发流程参考如下：

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
新建Flink Jar作业 - 数据湖探索 DLI

用户已上传到DLI资源管理系统的资源包名，用户自定义作业的依赖文件。示例："myGroup/test.cvs,myGroup/test1.csv"。通过在应用程序中添加以下内容可访问对应的依赖文件。其中，“fileName”为需要访问的文件名，“ClassName”为需要访问该文件的类名。 ClassName

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

创建Flink Jar作业并运行。创建Flink Jar作业，在应用程序、其他依赖文件选择步骤3导入Flink Jar，并指定主类。主要参数的填写说明：所属队列：选择Flink Jar作业运行的队列。应用程序：自定义的程序包主类：指定类名：输入类名并确定类参数列表（参数间用空格分隔）。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Map函数和运算符 - 数据湖探索 DLI

map_zip_with(map(K, V1), map(K, V2), function(K, V1, V2, V3)) 描述：通过将函数应用于具有相同键的一对值，将两个给定的map合并为一个map。对于仅在一个map中显示的键，将传递NULL作为缺少键的值。 SELECT ma

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
二进制函数和运算符 - 数据湖探索 DLI

varbinary 使用给定的key计算二进制块的HMAC值（采用 sha512）。 CRC32、MD5、SHA1算法在密码学场景已被攻击者破解，不建议应用于密码学安全场景。父主题： SQL函数和操作符

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符

总条数： 256

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive源表 - 数据湖探索 DLI

LIMIT | FETCH FIRST - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

Lambda 表达式 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

状态码 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

Map函数和运算符 - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线