搜索_华为云

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建OBS的桶。具体OBS操作可以参考《对象存储服务用户

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

数据湖探索（DLI）提供了丰富的字符串函数，用于处理和转换字符串数据。这些函数包括拼接、大小写转换、截取子串、替换、正则匹配、编码解码、格式转换等。此外，还支持字符串长度计算、位置查找、填充、反转等功能，以及从JSON字符串中提取值的JSON_VAL函数。这些功能广泛应用于数据清洗、文本处理和数据分析场景，为开发者提供强大的工具支持。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

数据湖探索（DLI）提供了丰富的字符串函数，用于处理和转换字符串数据。这些函数包括拼接、大小写转换、截取子串、替换、正则匹配、编码解码、格式转换等。此外，还支持字符串长度计算、位置查找、填充、反转等功能，以及从JSON字符串中提取值的JSON_VAL函数。这些功能广泛应用于数据清洗、文本处理和数据分析场景，为开发者提供强大的工具支持。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。若在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

用于对输入进行分区的列名。分区扫描参数，具体请参考分区扫描功能介绍。 scan.partition.num 否无 Integer 分区的个数。分区扫描参数，具体请参考分区扫描功能介绍。 scan.partition.lower-bound 否无 Integer 第一个分区的最小值。分区扫描参数，具体请参考分区扫描功能介绍。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。若在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门
Flink SQL作业类 - 数据湖探索 DLI

ry_rejected导致提交失败 Kafka Sink配置发送失败重试机制如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？作业语义检验时提示DIS通道不存在怎么处理？ Flink jobmanager日志一直报Timeout expired while

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

CU时收费。 enterprise_project_id 否 String 企业项目ID，“0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 platform 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

创建source流从Redis获取数据，作为作业的输入数据。前提条件要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

desc查询具体是哪些key引起的数据倾斜。然后对于倾斜Key单独做处理，加盐让其先将他分为多个task分别统计，最后再对分开统计结果进行结合统计。例如：如下SQL示例，假设已知倾斜key为'Key01',导致单个task处理大量数据，做如下处理： SELECT a.Key, SUM(a

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。如果在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Upsert Kafka结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与Kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接配置跨源

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

Native性能加速 Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

读取相应的数据。前提条件要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 create table jbdcSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

Native性能加速 Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Spark 3.3.1版本说明 - 数据湖探索 DLI

Native性能加速 Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Postgres CDC源表 - 数据湖探索 DLI

Once方式处理。前提条件 PostgreSQL CDC要求Postgre版本为9.6或者10，11，12。要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

从键值对列表构建JSON对象字符串。请注意，键必须是非NULL字符串文字，而值可以是任意表达式。函数返回一个JSON字符串。ON NULL行为定义了如何处理NULL值。如果省略，则默认为NULL ON NULL。从另一个JSON构造函数调用（JSON_OBJECT,JSON_ARRAY）创

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

交记录使其可见。用户控制何时/如何触发具有多个属性的提交。流式写入不支持插入覆盖。有关可用配置的完整列表，请参阅流式处理接收器。Streaming sink 前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 426

上一页
1
...
4
5
6
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

Flink SQL作业类 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线