搜索_华为云

Hudi数据表Clean规范 - 数据湖探索 DLI

文件。 Hudi表满足hoodie.cleaner.commits.retained设置的阈值。如果是Flink写hudi，则至少提交的checkpoint要超过这个阈值；如果是批写Hudi，则批写次数要超过这个阈值。建议 MOR表下游采用批量读模式，采用clean的版本数为compaction版本数+1。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

HBase表之前确保HBase的表是存在的。以样例代码为例，具体的流程是：远程登录ECS，通过hbase shell命令查看表信息。其中，“hbtest”是要查询的表名。 describe 'hbtest' （可选）如果不存在对应的HBase表，可以创建该表，具体的命令是： create ‘hbtest’

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
to_char - 数据湖探索 DLI
to_char - 数据湖探索 DLI

参数说明参数是否必选参数类型说明 date 是 DATE 或 STRING 代表需要处理的日期。格式为： yyyy-mm-dd yyyy-mm-dd hh:mi:ss yyyy-mm-dd hh:mi:ss.ff3 format 是 STRING 代表需要转换的目标日期格式。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

支持利用指定条件删除分区表的一个或多个分区。OBS表还支持按指定筛选条件删除分区。注意事项所要删除分区的表必须是已经存在的表，否则会出错。所要删除的分区必须是已经存在的，否则会出错，可通过语句中添加“IF EXISTS”避免该错误。语法格式 1 2 3 ALTER TABLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

参数说明参数是否必选说明 connector.type 是 connector类型，对于redis，需配置为'redis'。 connector.host 是 redis连接地址。 connector.port 是 redis连接端口。 connector.password 否

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
布尔类型 - 数据湖探索 DLI
布尔类型 - 数据湖探索 DLI

布尔类型 “真”值的有效文本值是：TRUE、't'、'true'、'1'。 “假”值的有效文本值是：FALSE、'f'、'false'、'0'。使用TRUE和FALSE是比较规范的用法（也是SQL兼容的用法）。示例： select BOOLEAN '0'; _col0 -------

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
对象存储OBS结果表 - 数据湖探索 DLI

参数说明表1 参数说明参数是否必选默认值类型说明 connector 是无 String 固定位filesystem。 path 是无 String OBS路径。 format 是无 String 文件格式。支持csv、parquet格式。 sink.rolling-policy

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
FileSystem结果表 - 数据湖探索 DLI

参数说明表1 参数说明参数是否必选默认值类型说明 connector 是无 String 固定位filesystem。 path 是无 String OBS路径。 format 是无 String 文件格式。支持csv、parquet格式。 sink.rolling-policy

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

'datagen' ); 参数说明表1 参数说明参数是否必选默认值数据类型参数说明 connector 是无 String 指定要使用的连接器，这里是'datagen'。 rows-per-second 否 10000 Long 每秒生成的行数，用以控制数据发出速率。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
covar - 数据湖探索 DLI
covar - 数据湖探索 DLI

命令格式 covar_pop(col1, col2) 参数说明表1 参数说明参数是否必选说明 col1 是数据类型为数值的列。其他类型返回NULL。 col2 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
covar - 数据湖探索 DLI
covar - 数据湖探索 DLI

命令格式 covar_samp(col1, col2) 参数说明表1 参数说明参数是否必选说明 col1 是数据类型为数值的列。其他类型返回NULL。 col2 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
创建表时指定表的生命周期 - 数据湖探索 DLI

ive语法创建OBS表。参数说明表1 参数说明参数名称是否必选参数说明 table_name 是需要设置生命周期的表名。 dli.lifecycle.days 是设置的生命周期时间，只能为正整数，单位为天。 external.table.purge 否仅OBS表支持配置该参数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
corr - 数据湖探索 DLI
corr - 数据湖探索 DLI

表1 参数说明参数是否必选参数类型说明 col1 是 DOUBLE、BIGINT、INT、SMALLINT、TINYINT、FLOAT、DECIMAL类型数据类型为数值的列。其他类型返回NULL。 col2 是 DOUBLE、BIGINT、INT、SMALLINT、TI

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

); 参数说明表1 参数说明参数是否必选说明 connector.type 是只能为user-defined，表示使用自定义的source。 connector.class-name 是 source函数的全限定类名。 connector.class-parameter

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Hudi Clustering操作说明 - 数据湖探索 DLI

Hudi Clustering操作说明什么是Clustering 即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hu

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

secretName 是无 String 在DEW服务的凭据管理中新建的通用凭据的名称。配置示例：spark.hadoop.fs.dew.csms.secretName=secretInfo spark.hadoop.fs.dew.endpoint 是无 String 指定

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
CREATE TABLE语句 - 数据湖探索 DLI

TIMESTAMP(3)，且是 schema 中的顶层列，它也可以是一个计算列。 watermark_strategy_expression 定义了 watermark 的生成策略。它允许使用包括计算列在内的任意非查询表达式来计算 watermark ；表达式的返回类型必须是 TIMESTAMP(3)，表示了从

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

'datagen' ); 参数说明表2 参数说明参数是否必选默认值数据类型参数说明 connector 是无 String 指定要使用的连接器，这里是'datagen'。 rows-per-second 否 10000 Long 每秒生成的行数，用以控制数据发出速率。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表

总条数： 647

上一页
1
...
23
24
25
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Clean规范 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

to_char - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

布尔类型 - 数据湖探索 DLI

Hudi - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

covar - 数据湖探索 DLI

covar - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

corr - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线