搜索_华为云

SDK的获取与安装 - 数据湖探索 DLI

安装Maven 。安装配置完成后，输入命令“mvn -v”,显示如下图 Maven版本信息表示成功。 Maven安装完成后，可根据开发需要，直接引入依赖到已有的Maven工程或先用开发工具创建Maven工程。创建项目以idea开发工具为例(已有Maven 工程可跳过此步骤)：打开IntelliJ

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

jar的作业。编写并打包Spark jar的程序包：（以Maven项目为例）创建或使用现有的maven java项目，在 pom.xml 中引入scala 2.12，spark 3.3.1 和hudi 0.11.0 版本的依赖。由于DLI环境已提供所需依赖，因此scope可以配置为provided。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Hudi Clustering操作说明 - 数据湖探索 DLI

置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能够支持快速摄取的同时不影响查询性能，引入了Clustering服务来重写数据以优化Hudi数据湖文件的布局。 Clustering服务可以异步或同步运行，Clustering会添

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
创建DLI自定义委托权限 - 数据湖探索 DLI

全局服务资源：全局服务部署时不区分区域，访问全局级服务，不需要切换区域，全局服务不支持基于区域项目授权。如对象存储服务（OBS）、内容分发网络（CDN）等。授权后，用户根据权限使用全局服务的资源。指定区域项目资源：授权后，IAM用户根据权限使用所选区域项目中的资源，未选择的区域项目中的资源，该IAM用户将无权访问。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
months - 数据湖探索 DLI
months - 数据湖探索 DLI

months_between months_between函数用于返回date1与date2之间的月份差。命令格式 months_between(string date1, string date2) 参数说明表1 参数说明参数是否必选参数类型说明 date1 是 DATE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
自定义函数类型推导 - 数据湖探索 DLI

的类及其求值方法中派生数据类型。然而以反射方式提取数据类型并不总是成功的，比如UDTF中常见的Row类型。由于 Flink 1.11 起引入了新的自定义函数注册接口，使用了新的自定义函数类型推断机制，因此原先1.10 重载 getResultType 声明返回字段类型的方式将不再可用。继续使用会抛出如下异常：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
自定义函数类型推导 - 数据湖探索 DLI

的类及其求值方法中派生数据类型。然而以反射方式提取数据类型并不总是成功的，比如UDTF中常见的Row类型。由于 Flink 1.11 起引入了新的自定义函数注册接口，使用了新的自定义函数类型推断机制，因此原先1.10 重载 getResultType 声明返回字段类型的方式将不再可用。继续使用会抛出如下异常：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

下truststore文件的路径，在初始化前将其引入properties中才能生效。 kafka source可以在open里引入。图1 获取kafka source kafka sink可以在initializeState里引入。图2 获取kafka sink 操作步骤从

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
to_char - 数据湖探索 DLI
to_char - 数据湖探索 DLI

to_char to_char函数用于将日期按照指定格式转换为字符串。命令格式 to_char(string date, string format) 参数说明表1 参数说明参数是否必选参数类型说明 date 是 DATE 或 STRING 代表需要处理的日期。格式为：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
创建Bucket索引表调优 - 数据湖探索 DLI

创建Bucket索引表调优创建Bucket索引表调优 Bucket索引常用设置参数： Spark： hoodie.index.type=BUCKET hoodie.bucket.index.num.buckets=5 Flink index.type=BUCKET hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
数据保护技术 - 数据湖探索 DLI

Spark作业传输通信加密 Spark作业支持通过配置表1中的参数开启通信加密。请确保已上传密钥和证书到指定的OBS路径下，并在作业配置中的其他依赖文件中引入。表1 Spark作业传输开启通信加密配置项参数说明配置示例 spark.network.crypto.enabled 该参数用于

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表模型设计规范规则 Hudi表必须设置合理的主键。 Hudi表提供了数据更新和幂等写入能力，该能力要求Hudi表必须设置主键，主键设置不合理会导致数据重复。主键可以为单一主键也可以为复合主键，两种主键类型均要求主键不能有null值和空值，可以参考以下示例设置主键： SparkSQL：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
date - 数据湖探索 DLI
date - 数据湖探索 DLI

date_sub date_sub函数按照days幅度递减startdate日期的天数。如需要获取当前日期基础上指定变动幅度的日期，可结合current_date或getdate函数共同使用。请注意date_sub函数与date_add函数逻辑反。命令格式 date_sub(string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
datediff - 数据湖探索 DLI
datediff - 数据湖探索 DLI

datediff datediff函数用于计算两个时间date1、date2的日期差值。相似函数：datediff1，datediff1函数用于计算两个时间date1、date2的差值，将差值以指定的时间单位datepart表示。命令格式 datediff(string date1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
weekday - 数据湖探索 DLI
weekday - 数据湖探索 DLI

weekday weekday函数用于返回日期值是当前周的第几天。命令格式 weekday (string date) 参数说明表1 参数说明参数是否必选参数类型说明 date 是 DATE或STRING 需要处理的日期。格式： yyyy-mm-dd yyyy-mm-dd

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
数学函数概览 - 数据湖探索 DLI

数学函数概览 DLI所支持的数学函数如数学函数所示。表1 数学函数函数命令格式返回值功能简介 abs abs(DOUBLE a) DOUBLE或INT 取绝对值。 acos acos(DOUBLE a) DOUBLE 返回给定角度a的反余弦值。 asin asin(DOUBLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

时间函数 Flink OpenSource SQL所支持的时间函数如表1所示。函数说明表1 时间函数函数返回值描述 DATE string DATE 将日期字符串以"yyyy-MM-dd"的形式解析为SQL日期。 TIME string TIME 将时间字符串以"HH:mm:ss[

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

时间函数 Flink OpenSource SQL所支持的时间函数如表1所示。函数说明表1 时间函数函数返回值描述 DATE string DATE 以“yyyy-MM-dd”的形式返回从字符串解析的 SQL 日期。 DATE_ADD STRING 指定日期增加目标天数后的日期，数据类型为STRING。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

时间函数 Flink OpenSource SQL所支持的时间函数如表1所示。函数说明表1 时间函数函数返回值描述 DATE string DATE 将日期字符串以"yyyy-MM-dd"的形式解析为SQL日期。 TIME string TIME 将时间字符串以"HH:mm:ss[

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数

总条数： 53

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SDK的获取与安装 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

months - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

to_char - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

date - 数据湖探索 DLI

datediff - 数据湖探索 DLI

weekday - 数据湖探索 DLI

数学函数概览 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线