搜索_华为云

DLI Hudi开发规范 - 数据湖探索 DLI

DLI Hudi开发规范 Hudi开发规范概述 Hudi数据表设计规范 Hudi数据表管理操作规范 Spark on Hudi开发规范 Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Hudi数据表设计规范 - 数据湖探索 DLI

Hudi数据表设计规范 Hudi表模型设计规范 Hudi表索引设计规范 Hudi表分区设计规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Spark datasource API语法参考 - 数据湖探索 DLI

Spark datasource API语法参考 Spark jar作业提交方式请参考在DLI使用Hudi提交Spark Jar作业 API语法说明 Hudi锁配置说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Hudi数据表管理操作规范 - 数据湖探索 DLI

Hudi数据表管理操作规范 Hudi数据表Compaction规范 Hudi数据表Clean规范 Hudi数据表Archive规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
DLI中使用Hudi开发作业 - 数据湖探索 DLI

DLI中使用Hudi开发作业在DLI使用Hudi提交Spark SQL作业在DLI使用Hudi提交Spark Jar作业在DLI使用Hudi提交Flink SQL作业使用HetuEngine on Hudi

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
DLI SDK功能矩阵 - 数据湖探索 DLI

DLI SDK功能矩阵 SDK开发指南指导您如何安装和配置开发环境、如何通过调用DLI SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Spark将不可为null的模式转换为可空说明：在Spark 2.4.x版本中，当用户指定的schema包含不可为空的字段时，Spark会将这些不可为null的模式转换为可空的。但是在Spark 3.3.x版本中，Spark尊重用户指定的schema中的nullability，即如果字段被定义为

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Hudi常见配置参数 - 数据湖探索 DLI

hudi.keygen.ComplexKeyGenerator 同步Hive表配置由DLI提供的元数据服务是一种Hive Metastore服务（HMS），因此下列参数与同步元数据服务相关。表2 同步Hive表参数配置参数描述默认值 hoodie.datasource.hive_sync

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

3.x：通过 `CREATE TABLE ... TBLPROPERTIES`和`ALTER TABLE ... SET TBLPROPERTIES`指定external属性，命令将会失败。如需在Spark3.3.x版本中恢复Spark2.4.x的使用方式，可以通过设置spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Hudi表使用约束 - 数据湖探索 DLI

preCombineField，否则存在数据最终表现与预期不一致的风险。使用由DLI提供的元数据服务时，不支持创建DLI表，只支持创建OBS表，即必须通过LOCATION参数配置表路径。使用由LakeFormation提供的元数据服务时，创建内表和外表均支持。需要注意：在DROP内表时，数据也会被同步删除。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
用户导表到OBS报“path obs://xxx already exists”错误 - 数据湖探索 DLI

用户导表到OBS报“path obs://xxx already exists”错误该提示信息说明您将数据导出到一个已经存在的OBS路径。解决方案：新建OBS目录。您可以新建一个不存在的OBS目录用于存储导出的数据。删除已存在的OBS目录。删除已存在的OBS目录后，目

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

ce表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不同的连接参数，并确保Flink作业能够正确地将数据路由到各个集群。例如本例中分别对es1和es2定义连接器类型以及相关的属性。在对应的Flink作业中添加如下SQL语句。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
查看表的用户权限（废弃） - 数据湖探索 DLI

tables.表名”，用户在当前表上的权限。 “databases.数据库名.tables.表名.columns.列名”，用户在列上的权限。示例值：databases.dsstest.tables.obs_231。 privileges 否 Array of Strings 用户在指定对象

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
CREATE VIEW语句 - 数据湖探索 DLI
CREATE VIEW语句 - 数据湖探索 DLI

[, columnName ]* }] [COMMENT view_comment] AS query_expression 功能描述通过定义数据视图的方式，将多层嵌套写在数据视图中，简化开发过程。语法说明 IF NOT EXISTS 若该视图已经存在，则不会进行任何操作。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
CREATE VIEW语句 - 数据湖探索 DLI
CREATE VIEW语句 - 数据湖探索 DLI

[, columnName ]* }] [COMMENT view_comment] AS query_expression 功能描述通过定义数据视图的方式，将多层嵌套写在数据视图中，简化开发过程。语法说明 IF NOT EXISTS 若该视图已经存在，则不会进行任何操作。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

源池”或“default队列”。推荐您购买弹性资源池，并在弹性资源池中创建队列，体验更丰富的DLI产品能力。如您有任何问题，可随时通过工单或者服务热线（4000-955-988或950808）与我们联系。 DLI“包年/包月”和“按需计费”计费模式队列生命周期表1 DLI“包

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DROP COLUMN - 数据湖探索 DLI
DROP COLUMN - 数据湖探索 DLI

table1 DROP COLUMNS a.b.c, x, y a.b.c 表示嵌套列全路径，嵌套列具体规则见ADD COLUMNS。系统响应通过运行DESCRIBE命令，可查看删除列。父主题： Schema演进语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

配置数据更新间隔。示例该示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
ROLL_BACK - 数据湖探索 DLI
ROLL_BACK - 数据湖探索 DLI

=> 'h1', instant_time=>'20220915113127525'); 注意事项只能依次回滚最新的commit时间戳，可以通过SHOW_TIME_LINE命令检查最新的instant time。系统响应可以检查任务状态是否成功，查看任务结果，查看任务日志确认有无异常。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

read.end-commit 否默认到最新 commit String Batch增量消费，通过参数“read.streaming.start-commit”指定起始消费位置，通过参数“read.end-commit”指定结束消费位置，为闭区间，即包含起始、结束的Commit，默认到最新Commit。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi

总条数： 1115

上一页
1
...
38
39
40
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI Hudi开发规范 - 数据湖探索 DLI

Hudi数据表设计规范 - 数据湖探索 DLI

Spark datasource API语法参考 - 数据湖探索 DLI

Hudi数据表管理操作规范 - 数据湖探索 DLI

DLI中使用Hudi开发作业 - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

用户导表到OBS报“path obs://xxx already exists”错误 - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

查看表的用户权限（废弃） - 数据湖探索 DLI

CREATE VIEW语句 - 数据湖探索 DLI

CREATE VIEW语句 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

DROP COLUMN - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

ROLL_BACK - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线