搜索_华为云

Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型 MOR表，COW表支持读写类型批量读，批量写，流式读，流式写 Hudi源表 Hudi 结果表父主题： Connector列表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hudi表模型设计规范 - 数据湖探索 DLI

相对较好，因此在流式计算场景下采用MOR表模型。关于MOR表在读写性能的对比关系如下：对比维度 MOR表 COW表流式写高低流式读高低批量写高低批量读低高实时入湖，表模型采用MOR表。实时入湖一般的性能要求都在分钟内或者分钟级，结合Hudi两种表模型

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi Archive操作说明 - 数据湖探索 DLI

题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发） hoodie.archive.automatic=true hoodie.keep.max.commits=30 // 默认值为30，根据业务场景指定

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
弹性资源池CU设置 - 数据湖探索 DLI

弹性资源池CU设置 CU设置主要是为了控制弹性资源池扩缩容的最大最小CU范围，避免无限制的资源扩容风险。例如，当前弹性资源池CU设置的最大CU为256CU，并且该弹性资源池添加了2个队列，2个队列扩缩容策略最小CU数为64CU，这时如果该弹性资源池再添加一个队列并且该队列最小C

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

name, age FROM my_source; 写数据至多个Sink表 EXECUTE STATEMENT SET BEGIN ... END; 是写数据至多个Sink表的必填语句，用于定义在同一个作业中执行多个插入数据的操作。写数据至多个Sink表时，EXECUTE STATEMENT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Hudi Clean操作说明 - 数据湖探索 DLI

SparkDataSource（option里设置如下参数，写数据时触发） hoodie.clean.automatic=true hoodie.cleaner.commits.retained=10 // 默认值为10，根据业务场景指定 Flink（with属性里设置如下参数，写数据时触发） clean.async

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Hudi表索引设计规范 - 数据湖探索 DLI

用Flink状态索引，Flink写入后，不支持Spark继续写入。 Flink在写Hudi的MOR表只会生成log文件，后续通过compaction操作，将log文件转为parquet文件。Spark在更新Hudi表时严重依赖parquet文件是否存在，如果当前Hudi表写的是log文件，采用Spark写入就会导致重复数据的产生。在批量初始化阶段

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
关系运算符 - 数据湖探索 DLI
关系运算符 - 数据湖探索 DLI

关系运算符所有数据类型都可用关系运算符进行比较，并返回一个BOOLEAN类型的值。关系运算符均为双目操作符，被比较的两个数据类型必须是相同的数据类型或者是可以进行隐式转换的类型。 DLI提供的关系运算符，请参见表1。表1 关系运算符运算符返回类型描述 A = B BOOLEAN

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 运算符
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_extract REGEXP_EXTRACT函数用于将字符串source按照pattern的分组规则进行字符串匹配，返回第groupid个组匹配到的字符串内容。命令格式 regexp_extract(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

访问数据库所需要的账号 connector.password 否访问数据库所需要的密码 connector.write.flush.max-rows 否写数据时，刷新数据的最大行数。默认值为5000 connector.write.flush.interval 否刷新数据的时间间隔，单位可以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DWS维表（不推荐使用） - 数据湖探索 DLI

"area_street_name":"d3","region_name":"e1"} 常见问题 Q：若Flink作业日志中有如下报错信息，应该怎么解决？ java.io.IOException: unable to open JDBC writer ... Caused by: org

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
分析窗口函数概览 - 数据湖探索 DLI

分析窗口函数概览 DLI所支持的分析窗口函数如分析窗口函数介绍所示。表1 分析窗口函数介绍函数命令格式返回值功能简介 cume_dist cume_dist() DOUBLE 用于求累计分布，相当于求分区中大于等于或小于等于当前行的数据在分区中的占比。 first_value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

"area_street_name":"d3","region_name":"e1"} 常见问题 Q：若Flink作业日志中有如下报错信息，应该怎么解决？ java.io.IOException: unable to open JDBC writer ... Caused by: org

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

"area_street_name":"d4","region_name":"e1"} 常见问题 Q：Flink作业日志中有如下报错信息应该怎么解决？ org.apache.zookeeper.ClientCnxn$SessionTimeoutException: Client session

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

"area_street_name":"d4","region_name":"e1"} 常见问题 Q：Flink作业日志中有如下报错信息应该怎么解决？ org.apache.zookeeper.ClientCnxn$SessionTimeoutException: Client session

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
查看Delta表历史操作记录 - 数据湖探索 DLI

job 运行该操作的作业的详细信息 notebook 运行操作的笔记的详细信息 clusterId 集群id readVersion 为执行写操作而读取的表的版本 isolationLevel 隔离级别 isBlindAppend 是否追加数据 operationMetrics 操

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

timestamp=2021-12-16T21:30:52.181, value=Bob 常见问题 Q：Flink作业运行失败，作业运行日志中如下报错信息，应该怎么解决？ org.apache.zookeeper.ClientCnxn$SessionTimeoutException: Client session

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

2021-03-25 12:03:00,0002,Bob,330110) 常见问题 Q：Flink作业运行失败，作业运行日志中如下报错信息，应该怎么解决？ Caused by: org.apache.flink.client.program.ProgramInvocationException:

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化，参考队列相关完成队列创建等操作。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

2021-03-25 12:03:00,0002,Bob,330110) 常见问题 Q：Flink作业运行失败，作业运行日志中如下报错信息，应该怎么解决？ Caused by: org.apache.flink.client.program.ProgramInvocationException:

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 180

上一页
1
...
5
6
7
8
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

关系运算符 - 数据湖探索 DLI

regexp - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

分析窗口函数概览 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

查看Delta表历史操作记录 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线