搜索_华为云

开启或关闭数据多版本 - 数据湖探索 DLI

其他多版本SQL语法请参考多版本备份恢复数据。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表语法可以参考使用Hive语法创建OBS表。语法格式开启多版本功能 ALTER TABLE [db_name.]table_name SET TBLPROPERTIES

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
Flink Jar作业开发基础样例 - 数据湖探索 DLI

实现与MRS Kafka、HBase、Hive、HDFS，DWS，DCS等数据源的交互。本章节以通过自定义作业与MRS进行交互为例进行说明。更多样例代码请通过DLI样例代码获取。环境准备登录MRS管理控制台，创建MRS集群，选择“开启kerberos”，勾选“Kafka”

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

时区或本地时区在纪元时间和 LocalDateTime 之间进行转换。Hive 0.x/1.x/2.x 使用本地时区，但 Hive 3.x 使用 UTC 时区。数据类型映射目前，Parquet 格式类型映射与 Apache Hive 兼容，但与 Apache Spark 有所不同： Timestamp：不论精度，映射

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

resource,...] resource: : JAR file_uri 注意事项如果在数据库中存在同名的函数，系统将会报错。只支持Hive语法创建函数。请注意避免该场景：如果创建的自定义函数F1指定类C1，程序包名JAR1，创建自定义函数F2也指定类C1，程序包JAR2，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

举个例子，您可以设置 orc.compress=SNAPPY 来允许spappy压缩。数据类型映射 Orc 格式类型的映射和 Apache Hive 是兼容的。下面的表格列出了 Flink 类型的数据和 Orc 类型的数据的映射关系。表2 数据类型映射 Flink数据类型 Orc物理类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

提升性能。 hive_sync.enable 否 false Boolean 是否向hive同步表信息。开启向hive同步表信息后会使用catalog相关权限，需配置访问catalog的委托权限。 hive_sync.mode 否 jdbc Enum Hive ops选择的模式：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
配置多版本过期数据回收站 - 数据湖探索 DLI

dir”即可开启回收站功能。开启和关闭多版本语法请参考开启或关闭数据多版本。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。语法格式 1 2 ALTER TABLE [db_name.]table_name SET TBLPROPERTIES

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
删除函数 - 数据湖探索 DLI
删除函数 - 数据湖探索 DLI

IF EXISTS：所删除的函数不存在时使用，可避免系统报错。注意事项删除一个已存在的函数。如果要删除的函数不存在，则系统报错。只支持HIVE语法。示例删除函数mergeBill。 1 DROP FUNCTION mergeBill; 父主题：自定义函数

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

'order_time', 'hive_sync.enable' = 'true', 'hive_sync.mode' = 'hms', 'hive_sync.table' = 'hudi_table', 'hive_sync.db' = 'default'

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
修改表生命周期的时间 - 数据湖探索 DLI

修改已存在的分区表或非分区表的生命周期。当第一次开启生命周期时，会扫描表/分区会扫描路径下的表数据文件，更新表/分区的LAST_ACCESS_TIME，耗时与分区数和文件数相关。约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。表生命周期功能支持Hive、DataSource语法

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

<dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec</artifactId> <version>1.2.1</version>

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
实时任务接入 - 数据湖探索 DLI

//同步hive表支持timestamp格式 'hive_sync.partition_extractor_class' = 'org.apache.hudi.hive.MultiPartKeysValueExtractor' //同步hive表的extractor类

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
设置多版本备份数据保留周期 - 数据湖探索 DLI

version.retention.days”调整保留周期。开启和关闭多版本功能SQL语法请参考开启或关闭数据多版本。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。语法格式 1 2 ALTER TABLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置为-1代表不限制返回的条数。是 50000 kyuubi.engine.dli.small.file.merge 配置是否开启小文件自动合并。默认为false，代表不开启。 true：开启 false：不开启是 true kyuubi.engine.dli.bi.type 用于指定BI工具类型。支持fine/

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置为-1代表不限制返回的条数。是 50000 kyuubi.engine.dli.small.file.merge 配置是否开启小文件自动合并。默认为false，代表不开启。 true：开启 false：不开启是 true kyuubi.engine.dli.bi.type 用于指定BI工具类型。支持fine/

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Hudi数据表Compaction规范 - 数据湖探索 DLI

// 关闭Clean操作 'hoodie.archive.automatic' = 'false' // 关闭Archive操作 Spark离线完成Compaction计划的执行，以及Clean和Archive操作在调度平台（可以使用华为的DataArts）运行

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK （推荐）方案1：使用临时AK/SK 建议使用临时AK/SK，获取方式可参见统一身份认证服务_获取临时AK/SK。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。表1

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
file - 数据湖探索 DLI
file - 数据湖探索 DLI

上6种数据格式，另一种是STORED AS，只能指定ORC和PARQUET。 ORC对RCFile做了优化，可以提供一种高效的方法来存储Hive数据。 PARQUET是面向分析型业务的列式存储格式。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

该样例代码的目录内容介绍如下： dli-flink-demo：开发Flink作业时的样例代码参考。例如，样例代码实现读取Kafka源表数据写入到HDFS、DWS、Hive等结果表中的功能。 dli-spark-demo：开发Spark作业时的样例代码参考。具体如下： “dli-spark-demo-obs”读取和写入OBS数据。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Hudi常见配置参数 - 数据湖探索 DLI

hoodie.datasource.hive_sync.username 使用jdbc方式同步Hive时，指定的用户名。 hive hoodie.datasource.hive_sync.password 使用jdbc方式同步Hive时，指定的密码。 hive hoodie.datasource

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考

总条数： 404

上一页
1
2
3
4
5
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开启或关闭数据多版本 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

删除函数 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

file - 数据湖探索 DLI

怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线