搜索_华为云

在Spark SQL作业中使用UDF - 数据湖探索 DLI

在Spark SQL作业中使用UDF 操作场景 DLI支持用户使用Hive UDF（User Defined Function，用户定义函数）进行数据查询等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

SQL作业读取Doris源表。前提条件该场景作业需要运行在DLI的独享队列上，因此要与Doris建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Doris维表 - 数据湖探索 DLI
Doris维表 - 数据湖探索 DLI

创建Doris维表用于与输入流连接生成宽表。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

SQL作业写Doris结果表。前提条件该场景作业需要运行在DLI的独享队列上，因此要与Doris建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

 </plugins>  </build> 随后在main目录下创建scala目录，并新建一个包，随后在包目录下新建一个scala文件，在里面写入： import org.apache.spark.sql.catalyst

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
创建DLI程序包 - 数据湖探索 DLI

包或文件。前提条件所使用的程序包需提前上传至OBS服务中保存。创建程序包步骤在管理控制台左侧，单击“数据管理”>“程序包管理”。在“程序包管理”页面，单击右上角“创建”可创建程序包。在“创建程序包”对话框，参见表1设置相关参数。图1 创建程序包表1 参数说明参数名称

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
创建Hbase维表 - 数据湖探索 DLI
创建Hbase维表 - 数据湖探索 DLI

创建Hbase维表用于与输入流连接。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

创建Hbase维表用于与输入流连接生成宽表。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

创建Hbase维表用于与输入流连接生成宽表。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表如果需要关联OBS桶中嵌套的JSON格式数据，可以使用异步模式创建表。以下是一个示例的建表语句，展示了如何使用 JSON 格式选项来指定 OBS 中的路径： create table tb1 using json options(path

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ kafka message { "id": 1234567890, "name": "swq", "date": "1997-04-25", "obj": { "time1": "12:12:12"

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业本节操作介绍在DLI使用Hudi提交Flink SQL作业的操作步骤。具体语法说明请参考Flink OpenSource SQL1.15语法概览。进入DLI控制台，随后单击左侧菜单的“作业管理 > Flink作业”，进入Flink作业的界面。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
状态码 - 数据湖探索 DLI
状态码 - 数据湖探索 DLI

Failed 未满足前提条件，服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
设置多版本备份数据保留周期 - 数据湖探索 DLI

设置多版本备份数据保留周期功能描述在DLI数据多版本功能开启后，备份数据默认保留7天，您可以通过配置系统参数“dli.multi.version.retention.days”调整保留周期。保留周期外的多版本数据后续在执行insert overwrite或者truncate语

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
导出DLI表数据至OBS中 - 数据湖探索 DLI

页面。在“数据管理”页面导出数据。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需导出数据的表对应的数据库，进入该数据的“表管理”页面。在对应表（DLI表）的“操作”栏中选择“更多”中的“导出”，弹出“导出数据”页面。在“SQL编辑器”页面导出数据。在管理控制台左侧，单击“SQL编辑器”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？问题现象手动在OBS表的分区目录下上传了分区数据，但是在SQL编辑器中查询该表新增的分区数据时却查询不到。解决方案手动添加分区数据后，需要刷新OBS表的元数据信息。具体操作如下： MSCK REPAIR TABLE

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink作业性能调优 - 数据湖探索 DLI

由于Flink的反压机制，流作业在存在性能问题的情况下，会导致数据源消费速率跟不上生产速率，从而引起Kafka消费组的积压。在这种情况下，可以通过算子的反压和时延，确定算子的性能瓶颈点。作业最后一个算子(Sink)反压正常（绿色），前面算子反压高（红色）该场景说明性能瓶颈点在sink，此时需

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

WS）里创建了DWS集群。如何创建DWS集群，请参考《数据仓库服务管理指南》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表

总条数： 547

上一页
1
2
3
4
5
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDF - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

Doris源表 - 数据湖探索 DLI

Doris维表 - 数据湖探索 DLI

Doris结果表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

创建Hbase维表 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

状态码 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线