搜索_华为云

字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

数据湖探索（DLI）提供了丰富的字符串函数，用于处理和转换字符串数据。这些函数包括拼接、大小写转换、截取子串、替换、正则匹配、编码解码、格式转换等。此外，还支持字符串长度计算、位置查找、填充、反转等功能，以及从JSON字符串中提取值的JSON_VAL函数。这些功能广泛应用于数据清洗、文本处理和数据分析场景，为开发者提供强大的工具支持。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

数据湖探索（DLI）提供了丰富的字符串函数，用于处理和转换字符串数据。这些函数包括拼接、大小写转换、截取子串、替换、正则匹配、编码解码、格式转换等。此外，还支持字符串长度计算、位置查找、填充、反转等功能，以及从JSON字符串中提取值的JSON_VAL函数。这些功能广泛应用于数据清洗、文本处理和数据分析场景，为开发者提供强大的工具支持。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
费用账单 - 数据湖探索 DLI
费用账单 - 数据湖探索 DLI

某个时间段的使用量和计费信息。账单上报周期包年/包月计费模式的资源完成支付后，会实时上报一条账单到计费系统进行结算。按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同，分为按小时、按天、按月三种周期进行结算，具体扣费规则可以参考相关资源的计费说明。

帮助中心 > 数据湖探索 DLI > 计费说明
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

数据湖探索（DLI）提供了丰富的字符串函数，用于处理和转换字符串数据。这些函数包括拼接、大小写转换、截取子串、替换、正则匹配、编码解码、格式转换等。此外，还支持字符串长度计算、位置查找、填充、反转等功能，以及从JSON字符串中提取值的JSON_VAL函数。这些功能广泛应用于数据清洗、文本处理和数据分析场景，为开发者提供强大的工具支持。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

JSON 消息解析为 INSERT / UPDATE / DELETE 消息到 Flink SQL 系统中。在很多情况下，利用这个特性非常的有用，例如将增量数据从数据库同步到其他系统日志审计数据库的实时物化视图关联维度数据库的变更历史，等等。 Flink 还支持将 Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
DLI弹性资源池和队列类 - 数据湖探索 DLI

DLI弹性资源池和队列类怎样查看弹性资源池和作业的资源使用情况？怎样判断当前DLI队列中的作业是否有积压？怎样查看DLI队列负载？怎样监控DLI队列上的作业异常？怎样将老版本的Spark队列切换成通用型队列在default队列执行DLI SQL失败，提示超时异常怎么办？

帮助中心 > 数据湖探索 DLI > 常见问题
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DLI的这种模式减轻了运维负担，可以更专注于数据处理和分析任务本身。具体请参考《数据湖探索用户指南》。 MRS服务Spark组件的是建立在客户的购买MRS服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。 MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1 Flink作业配置参数对于Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建表时指定表的生命周期 - 数据湖探索 DLI

和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置，避免因误操作丢失数据。表的回收规则在创建表时通过TBLPROPERTIES指定表的生命周期。非分区表如果表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
创建DLI自定义委托权限 - 数据湖探索 DLI

DLI 访问LakeFormation元数据。访问LakeFormation Catalog元数据的权限操作流程图1 自定义委托操作流程约束与限制自定义委托名称不可与系统默认委托重复，即不可以是dli_admin_agency、dli_management_agency、dl

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDTF函数开发流程参考如下：图1 UDTF开发流程表2 开发流程说明序号阶段操作界面说明 1 新建Maven工程，配置pom文件 IntelliJ IDEA

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。若在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

JSON 消息解析为 INSERT / UPDATE / DELETE 消息到 Flink SQL 系统中。在很多情况下，利用这个特性非常的有用，例如将增量数据从数据库同步到其他系统日志审计数据库的实时物化视图关联维度数据库的变更历史，等等。 Flink 还支持将 Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。若在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

desc查询具体是哪些key引起的数据倾斜。然后对于倾斜Key单独做处理，加盐让其先将他分为多个task分别统计，最后再对分开统计结果进行结合统计。例如：如下SQL示例，假设已知倾斜key为'Key01',导致单个task处理大量数据，做如下处理： SELECT a.Key, SUM(a

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Spark 3.3.1版本说明 - 数据湖探索 DLI

Native性能加速 Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。如果在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

schema_name 描述 DATABASE和SCHEMA在此处是等价的，可互换的，它们有这相同的含义。该语法用于显示SCHEMA的名称、注释、还有它在文件系统上的根路径。可选项EXTENDED可以用来显示SCHEMA的数据库属性。示例 CREATE SCHEMA web; DESCRIBE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
current - 数据湖探索 DLI
current - 数据湖探索 DLI

current_date函数用于返回当前日期值。返回值格式为yyyy-mm-dd。相似函数：getdate，getdate函数用于返回当前系统时间。返回值格式为yyyy-mm-dd hh:mi:ss。命令格式 current_date() 参数说明无返回值说明返回DATE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数

总条数： 593

上一页
1
...
6
7
8
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

字符串函数 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

费用账单 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

DLI弹性资源池和队列类 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

current - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线