搜索_华为云

在Spark SQL作业中使用UDF - 数据湖探索 DLI

分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。创建UDF函数。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。图11 选择队列和数据库在SQL编辑区域输入下列命令创建UDF函数，单击“执行”提交创建。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Elasticsearch结果表 - 数据湖探索 DLI

站内搜索等场景。云搜索服务（Cloud Search Service，简称CSS）为DLI提供托管的分布式搜索引擎服务，完全兼容开源Elasticsearch搜索引擎，支持结构化、非结构化文本的多条件检索、统计、报表。云搜索服务的更多信息，请参见《云搜索服务用户指南》前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

binlog 偏移的发送心跳事件的间隔。 debezium.* 否无 String 将 Debezium 的属性传递给 Debezium 嵌入式引擎，该引擎用于从 MySQL 服务器捕获数据更改。例如: 'debezium.snapshot.mode' = 'never'. 查看更多关于

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
查询所有作业 - 数据湖探索 DLI

_desc（作业提交时间降序）、start_time_asc（作业提交时间升序）四种排序方式。 engine-type 否 String 引擎类型。 owner 否 String 提交作业的用户。 tags 否 String 指定作业标签作为过滤条件，支持多标签过滤，格式为“key=value”。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。 default 单击“下一步”，配置队列的扩缩容策略。

帮助中心 > 数据湖探索 DLI > 快速入门
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。 default 单击“下一步”，配置队列的扩缩容策略。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。 default 单击“下一步”，配置队列的扩缩容策略。

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI分析账单消费数据 - 数据湖探索 DLI

在DLI上进行消费明细分析。将1下载的消费明细数据上传到已建好的OBS桶中。在数据湖探索服务中创建表。登录DLI控制台，左侧导航栏单击“SQL编辑器”，执行引擎选择“spark”，选择执行的队列和数据库。本次演示队列和数据库选择“default”。下载的文件中包含时间用量等，按表头意义在DLI上

 帮助中心 > 数据湖探索 DLI > 最佳实践
提交SQL作业（推荐） - 数据湖探索 DLI

tags 否 Array of Objects 作业的标签。具体请参考表4。 engine_type 否 String 选择执行作业的引擎类型。表3 conf参数说明参数名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

单击“确定”，完成创建程序包。创建UDAF函数。登录登录DLI管理控制台，创建SQL队列和数据库。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。在SQL编辑区域输入下列命令创建UDAF函数，单击“执行”提交创建。如果该客户开启

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

程序包。单击“确定”，完成创建程序包。图11 创建程序包创建DLI的UDTF函数。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。图12 选择队列和数据库在SQL编辑区域输入实际上传Jar包的路径创建UDTF函数，单击“执行”提交创建。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

precombine.field 是无 String 数据合并字段基于此字段的大小来判断消息是否进行更新。如果您没有设置该参数，则系统默认会按照消息在引擎内部处理的先后顺序进行更新。 write.payload.class 否无 String write.payload.class 参数用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Notebook作业运行所在的队列。本例配置为步骤1：创建弹性资源池并添加通用队列中创建的队列。 Spark Version Spark引擎版本。当前仅Spark 3.3.1版本支持使用Notebook实例提交DLI作业。 Spark参数(--conf) 该参数用于配置DLI作业的自定义参数。

帮助中心 > 数据湖探索 DLI > 用户指南
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

业前您需要根据业务场景定义数据库和表。除了DLI元数据，DLI还支持对接LakeFormation实现元数据的统一管理，无缝对接多种计算引擎及大数据云服务，便捷高效地构建数据湖和运营相关业务。发布区域：全部 OBS 2.0支持 DLI元数据 DLI元数据是SQL作业、Spar

帮助中心 > 数据湖探索 DLI > 功能总览
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。 default 单击“下一步”，配置队列的扩缩容策略。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
DLI弹性资源池与队列简介 - 数据湖探索 DLI

或需要保证资源的作业，建议购买弹性资源池并在弹性资源池中创建队列来执行作业。 SQL队列： SQL队列是用于执行SQL作业的队列，支持指定引擎类型包括Spark和HetuEngine。 SQL队列适用于需要快速数据查询和分析，以及需要定期清理缓存或重置环境的业务。通用队列：通

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Postgres CDC源表 - 数据湖探索 DLI

该示例是利用Postgres-CDC实时读取RDS PostgreSQL中的数据，并写入到Print结果表中，其具体步骤如下（当前示例使用的数据库引擎版本是RDS PostgreSQL 11.11）：参考增强型跨源连接，根据PostgreSQL所在的虚拟私有云和子网创建相应的增强型跨源

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

该示例是利用MySQL-CDC实时读取RDS MySQL中的数据，并写入到Print结果表中，其具体步骤如下（本示例使用RDS MySQL数据库引擎版本为MySQL 5.7.32）。参考增强型跨源连接，根据MySQL所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用CDM迁移数据至DLI - 数据湖探索 DLI

移成功。在DLI查看数据迁移结果确认CDM迁移作业运行完成后，登录到DLI管理控制台。单击“SQL编辑器”。在SQL编辑器中“执行引擎”选择“spark”，“队列”选择已创建的SQL队列，数据库选择已创建的数据库，执行DLI表查询语句，查询MySQL数据是否已成功迁移到DLI的表中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Flink Jar作业开发基础样例 - 数据湖探索 DLI

日志输出实现类JAR包（例如：log4j等）上传自定义配置到OBS的桶必须为主账号下所创建的OBS桶。使用Flink1.15版本的计算引擎时，需要用户自行配置委托，否则可能影响作业运行。详细操作请参考自定义DLI委托权限。使用方法创建并提交Flink jar作业，详细操

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南

总条数： 102

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDF - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线