搜索_华为云

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
创建并使用跨源链接 - 数据湖探索 DLI

创建并使用跨源链接场景描述本章节指导用户通过API创建增强型跨源连接。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。创建增强型跨源连接之前需要获取需要建立连接的服务对应VPC的ID和其所在子网的网络ID。获取VPC的ID接口，具体请参考《虚拟私有云

 帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业本节操作介绍在DLI使用Hudi提交Flink SQL作业的操作步骤。具体语法说明请参考Flink OpenSource SQL1.15语法概览。进入DLI控制台，随后单击左侧菜单的“作业管理 > Flink作业”，进入Flink作业的界面。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

--queue <queue_name> word_count.py 请使用"./spark-submit"，不要使用"spark-submit"，后者可能会使用本地环境中已有的Spark环境，而不是DLI队列。父主题：使用客户端工具连接DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

创建作业提交任务前，建议先开通云审计服务，用于记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。云审计服务支持的DLI操作列表详见使用CTS审计DLI服务。关于如何开通云审计服务以及如何查看追踪事件，请参考《云审计服务快速入门》。创建Flink OpenSource SQL作业在DLI管理控制

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业登录DLI管理控制台，选择“SQL编辑器”首进入提交SQL作业的界面。提交SQL作业时需要选择支持Hudi的Spark SQL队列。创建一张Hudi表：将如下的建表语句粘贴至DLI SQL编辑器的输入区域，修改 LOCATION

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 1. 添加如下依赖 <dependency> <groupId>io.delta</groupId> <artifactId>delta-core_2.12</artifactId> <version>2.3

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka 概述本节操作介绍使用Flink Jar连接开启SASL_SSL认证的Kafka的操作方法。如需使用Flink OpenSource SQL连接开启SASL_SSL认证的Kafka，请参考Flink SQL语法参考-Kafka源表。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

详细的数据说明请参考数据说明。图1 方案简介流程指导使用DLI进行驾驶行为数据分析的操作过程主要包括以下步骤：步骤1：上传数据。将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。步骤2：分析数据。使用DLI对待分析的数据进行查询。示例代码具体样例数据及详细SQL语句可以通过数据包进行下载。

帮助中心 > 数据湖探索 DLI > 最佳实践
使用BI工具连接DLI分析数据 - 数据湖探索 DLI

使用BI工具连接DLI分析数据 BI工具连接DLI方案概述配置DBeaver连接DLI进行数据查询和分析配置DBT连接DLI进行数据调度和分析配置YongHong BI连接DLI进行数据查询和分析配置Superset连接DLI进行数据查询和分析配置PowerBI通过Kyuubi连接DLI进行数据查询和分析

 帮助中心 > 数据湖探索 DLI > 最佳实践
DLI中使用Hudi开发作业 - 数据湖探索 DLI

DLI中使用Hudi开发作业在DLI使用Hudi提交Spark SQL作业在DLI使用Hudi提交Spark Jar作业在DLI使用Hudi提交Flink SQL作业使用HetuEngine on Hudi

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
使用客户端工具连接DLI - 数据湖探索 DLI

使用客户端工具连接DLI 使用JDBC提交SQL作业使用Spark-submit提交Spark Jar作业使用Livy提交Spark Jar作业

 帮助中心 > 数据湖探索 DLI > 开发指南
DLI中使用Delta开发作业 - 数据湖探索 DLI

DLI中使用Delta开发作业 DLI Delta元数据在DLI使用Delta提交Spark Jar作业

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

数。约束限制在DLI Console上执行UDAF相关操作时，需要使用自建的SQL队列。跨账号使用UDAF时，除了创建UDAF函数的用户，其他用户如果需要使用时，需要先进行授权才可使用对应的UDAF函数。授权操作参考如下：登录DLI管理控制台，选择“ 数据管理 > 程序包管理”页面，选择对应的UDAF

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDF - 数据湖探索 DLI

SQL作业中使用UDF 操作场景 DLI支持用户使用Hive UDF（User Defined Function，用户定义函数）进行数据查询等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

约束限制在DLI Console上执行UDTF相关操作时，需要使用自建的SQL队列。不同的IAM用户使用UDTF时，除了创建UDTF函数的用户，其他用户如果需要使用时，需要先进行授权才可使用对应的UDTF函数。授权操作参考如下：登录DLI管理控制台，选择“ 数据管理 > 程序包管理”页面，选择对应的UDTF

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

该功能公测阶段，如需使用请提交工单申请开通“使用Spark作业访问DLI元数据”的使用权限。约束限制如果使用Spark 3.1访问元数据，则必须新建队列。不支持的场景：在SQL作业中创建了数据库（database），编写程序代码指定在该数据库下创建表。例如在DLI的SQL编辑器

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
创建并使用LakeFormation元数据 - 数据湖探索 DLI

创建并使用LakeFormation元数据 DLI对接LakeFormation LakeFormation资源权限支持列表与策略项父主题：创建数据库和表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
使用Hive语法创建OBS表 - 数据湖探索 DLI

示例3：使用CTAS语句将源表的全部数据或部分数据创建新的OBS表示例说明：根据示例1：创建OBS非分区表中创建的OBS表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

使用SQL作业模板开发并提交SQL作业为了便捷快速地执行SQL操作，DLI支持定制模板或将正在使用的SQL语句保存为模板。保存模板后，不需编写SQL语句，可通过模板直接执行SQL操作。当前系统提供了多条标准的TPC-H查询语句模板，您可以按需选择自定义模板或系统模板创建SQL作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板

总条数： 1009

上一页
1
2
3
4
5
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

使用BI工具连接DLI分析数据 - 数据湖探索 DLI

DLI中使用Hudi开发作业 - 数据湖探索 DLI

使用客户端工具连接DLI - 数据湖探索 DLI

DLI中使用Delta开发作业 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

创建并使用LakeFormation元数据 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线