搜索_华为云

显示所有函数 - 数据湖探索 DLI

注意事项显示与给定正则表达式或函数名匹配的函数。如果未提供正则表达式或名称，则显示所有函数。如果声明了USER或SYSTEM，那么将分别显示用户定义的Spark SQL函数和系统定义的Spark SQL函数。示例查看当前的所有函数。 1 SHOW FUNCTIONS; 父主题：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
pyspark样例代码 - 数据湖探索 DLI

通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过DataFrame API 访问 from __future__

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建OBS的桶。具体OBS操作可以参考《对象存储服务用户指南》。本指导中的OBS桶名都为“dli-test-021”。已创建DLI的SQL队列。创建队列详细介绍请参考创建队列。注意：创建队列时，队列类型必须要选择为：SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

创建函数功能描述 DLI支持创建使用UDF和UDTF等自定义函数应用于Spark作业开发当中。具体使用自定义函数端到端的开发指导可以参考：Spark SQL作业使用UDF和Spark SQL作业使用UDTF。语法格式 1 2 3 4 5 CREATE FUNCTION [db_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。通过管理控制台创建跨源连接请参考《数据湖探索用户指南》。通过API创建跨源连接请参考《数据湖探索API参考》。父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
停止计费 - 数据湖探索 DLI
停止计费 - 数据湖探索 DLI

停止计费包年/包月资源对于包年/包月计费模式的资源，例如包年/包月的弹性资源池、包年/包月的队列等，用户在购买时会一次性付费，服务将在到期后自动停止使用。如果在计费周期内不再使用包年/包月资源，您可以执行退订操作，系统将根据资源是否属于五天无理由退订、是否使用代金券和折扣券

 帮助中心 > 数据湖探索 DLI > 计费说明
配置Hudi数据列默认值 - 数据湖探索 DLI

配置Hudi数据列默认值该特性允许用户在给表新增列时，设置列的默认值。查询历史数据时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

Flink 1.15版本新增读写Hive、Hudi等Connector。更多Flink 1.15版本的优势请参考Flink 1.15升级指导。切换至新版本计算引擎对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。如何升级到Flink

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

CDC源表、Redis源表、Upsert Kafka源表、Hbase源表更多升级Flink 1.12版本的优势请参考Flink 1.12升级指导。切换至新版本计算引擎对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。如何升级到Flink

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

在DLI执行作业时，为了避免因字符编码不一致导致的乱码问题，建议您统一数据源的编码格式。 DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSON等）是以UTF-8编码保存的。如果数据源不是UTF

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

使用DEW获取访问凭证读写OBS 访问OBS的AKSK为例介绍Flink Jar使用DEW获取访问凭证读写OBS的操作指导。用户获取Flink作业委托临时凭证 DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？ - 数据湖探索 DLI

优惠。自建队列购买方式如下：购买队列请参考创建队列。弹性资源池购买方式如下：具体弹性资源池的购买和添加队列操作可以参考《数据湖探索用户指南》中的“创建弹性资源池”和“弹性资源池添加队列”相关章节。父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

//redis.io/。前提条件要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 1 2 3 4

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

数据探索湖 > 队列监控 > 队列CU使用量” 。计算剩余CU量。队列剩余CU量=队列CU量 - 队列CU使用量。当队列剩余CU量小于用户提交的CU量，则需要等待资源，才能提交成功。父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

String 仅用于FileSystem，avro 压缩编解码器。默认 snappy 压缩。目前支持：null, deflate、snappy、bzip2、xz。数据类型映射目前，Avro schema 通常是从 table schema 中推导而来。尚不支持显式定义 Avro schema。因此，下表列出了从

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

确认客户esdk-obs-java-3.1.3.jar的版本。确认是集群存在问题。处理步骤设置依赖关系provided。重启clusteragent应用集群升级后的配置。去掉OBS依赖，否则checkpoint会写不进OBS。父主题： Flink Jar作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

在DLI管理控制台的“全局配置 > 作业配置” 页查看对应OBS桶是否被设置为了DLI日志桶，日志桶不能用于DLI的其他业务功能中。确认桶是否应用于其他业务功能。如果是，您可以在DLI管理控制台页面更改作业配置，选择其他未被占用的OBS桶用于DLI日志存储。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Hudi表分区设计规范 - 数据湖探索 DLI

各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样会出现越细粒度的分区，桶的个数会冗余越多。例如：采用天级分区，平均的日增数据量是3GB，最多一天的日志是8GB，这个会采用Bucket桶数= 8GB/2GB = 4 来创建表；每天的更新数据占比较

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Python开发环境配置 - 数据湖探索 DLI

检验是否配置成功，运行cmd ，输入 python。运行结果，请参见图1，显示版本信息，则说明安装和配置成功。图1 检验配置是否成功 python安装应用包时出现错误类似错误“error: Microsoft Visual C++ xx.x is required. Get it with Build

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
数学运算函数 - 数据湖探索 DLI

UE。注意事项 double、real和float值存在一定的精度差。且我们不建议直接使用等号“=”对两个double类型数据进行比较。用户可以使用两个double类型相减，而后取绝对值的方式判断。当绝对值足够小时，认为两个double数值相等，例如: abs(0.9999999999

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数

总条数： 1036

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

显示所有函数 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

停止计费 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？ - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线