搜索_华为云

API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

API概览本章节介绍了目前DLI所提供的API列表。表1 DLI API列表类型说明权限相关API 包括队列赋权、查看队列的使用者、数据赋权、查看数据库的使用者、查看表的使用者、查看表的用户权限和查看赋权对象使用者权限信息。全局变量相关API 包括创建全局变量、删除全

 帮助中心 > 数据湖探索 DLI > API参考
Hudi开发规范概述 - 数据湖探索 DLI

Hudi开发规范概述范围本节内容介绍DLI-Hudi组件进行湖仓一体、流批一体方案的设计与开发方面的规则，适用于Hudi开发场景的表的设计、管理与作业开发。主要包括以下方面的规范：数据表设计资源配置性能调优常见故障处理常用参数配置术语约定本规范采用以下的术语描述：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
DLI Hudi开发规范 - 数据湖探索 DLI

DLI Hudi开发规范 Hudi开发规范概述 Hudi数据表设计规范 Hudi数据表管理操作规范 Spark on Hudi开发规范 Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Spark on Hudi开发规范 - 数据湖探索 DLI

Spark on Hudi开发规范 SparkSQL建表参数规范 Spark增量读取Hudi参数规范 Spark异步任务执行表compaction参数设置规范 Spark表数据维护规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
SparkSQL建表参数规范 - 数据湖探索 DLI

--预合并字段，相同主键的数据会按该字段合并，当前不能指定多个字段 ) 父主题： Spark on Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Hudi数据表管理操作规范 - 数据湖探索 DLI

Hudi数据表管理操作规范 Hudi数据表Compaction规范 Hudi数据表Clean规范 Hudi数据表Archive规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Hudi数据表设计规范 - 数据湖探索 DLI

Hudi数据表设计规范 Hudi表模型设计规范 Hudi表索引设计规范 Hudi表分区设计规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Spark表数据维护规范 - 数据湖探索 DLI

除Spark以外，其他引擎也可以修改Hudi表元数据，但是这种修改会导致整个Hudi表出现数据重复，甚至数据损坏；因此禁止修改上述属性。父主题： Spark on Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

timestamp进行过滤。提交其他SQL时，需要清除上述配置参数，避免影响其他任务执行结果。父主题： Spark on Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Flink作业开发指南 - 数据湖探索 DLI

Flink作业开发指南流生态作业开发指引 Flink OpenSource SQL作业开发 Flink Jar作业开发基础样例使用Flink Jar写入数据到OBS开发指南使用Flink Jar连接开启SASL_SSL认证的Kafka 使用Flink Jar读写DIS开发指南 Flink作业委托场景开发指导

 帮助中心 > 数据湖探索 DLI > 开发指南
Hudi表模型设计规范 - 数据湖探索 DLI

Datasource API或者Flin写Hudi表的场景，通过这两种方式写Hudi时需要增加向Hive同步元数据的配置项；该配置的目的是将Hudi表的元数据统一托管到Hive元数据服务中，为后续的跨引擎操作数据以及数据管理提供便利。父主题： Hudi数据表设计规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi数据表Compaction规范 - 数据湖探索 DLI

park异步执行Compaction，不...中提到的异步Compaction任务，这里给出以下开发建议：不需要对每张Hudi表都开发异步Compaction任务，这样会导致作业开发成本上升。异步Compaction任务可以通过提交Spark SQL作业来完成，也可以在Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi数据表Clean规范 Clean也是Hudi表的维护操作之一，该操作对于MOR表和COW表都需要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Spark作业开发类 - 数据湖探索 DLI

Spark作业开发类 Spark作业使用咨询 Spark如何将数据写入到DLI表中通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
历史API - 数据湖探索 DLI
历史API - 数据湖探索 DLI

历史API 委托相关API（废弃）分组资源相关API（废弃） Spark批处理相关API（废弃） SQL作业相关API（废弃）资源相关API（废弃）权限相关API（废弃）队列相关API（废弃）跨源认证相关API（废弃）增强型跨源连接相关API（废弃）模板相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考
Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

only.inline=true 执行SQL run compaction on dsrTable; 父主题： Spark on Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Bucket调优示例 - 数据湖探索 DLI

Bucket调优示例创建Bucket索引表调优 Hudi表初始化实时任务接入离线Compaction配置父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范

总条数： 675

上一页
1
2
3
4
5
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

API概览 - 数据湖探索 DLI

Hudi开发规范概述 - 数据湖探索 DLI

DLI Hudi开发规范 - 数据湖探索 DLI

Spark on Hudi开发规范 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

Hudi数据表管理操作规范 - 数据湖探索 DLI

Hudi数据表设计规范 - 数据湖探索 DLI

Spark表数据维护规范 - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

Flink作业开发指南 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

历史API - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

Bucket调优示例 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线