搜索_华为云

使用HetuEngine on Hudi - 数据湖探索 DLI

HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine对Hudi仅支持select操作，即支持SELECT语法来查询Hudi表中的数据。 He

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP BY）、多表的关联（JOIN）等。本示例通过创建PostgreSQL CDC源表来监控Postgres的数据变化，并将变化的数据信息插入到DWS数据库中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查询HBase表 - 数据湖探索 DLI
查询HBase表 - 数据湖探索 DLI

Client将过滤条件传给HBase服务端进行处理，HBase服务端只返回用户需要的数据，提高了Spark SQL查询的速度。对于HBase不支持的过滤条件，例如组合Rowkey的查询，直接由Spark SQL进行。支持查询下压的场景数据类型场景 Int boolean short long double

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
last - 数据湖探索 DLI
last - 数据湖探索 DLI

expr 是待计算返回结果的表达式。 ignore_nulls 否 BOOLEAN类型，表示是否忽略NULL值。默认值为False。当参数的值为True时，返回窗口中第一条非NULL的值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
在DLI控制台删除表 - 数据湖探索 DLI

在DLI控制台删除表根据实际使用情况，您可以通过删除表。注意事项具有正在运行中的作业的数据库或者表不能删除。管理员用户、表的所有者和具有删除表权限的用户可以删除表。数据表删除后，将不可恢复，请谨慎操作。删除表删除表的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面删除表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
Hudi Archive操作说明 - 数据湖探索 DLI

什么是Archive Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
DISTRIBUTE BY - 数据湖探索 DLI
DISTRIBUTE BY - 数据湖探索 DLI

BY：根据指定的字段进行分桶，支持单字段及多字段，不会在桶内进行排序。与SORT BY配合使用即为分桶后的排序。注意事项所排序的表必须是已经存在的，否则会出错。举例根据字段score对表student进行分桶。 1 2 SELECT * FROM student DISTRIBUTE BY score;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
恢复多版本备份数据 - 数据湖探索 DLI

DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。语法格式恢复非分区表数据到指定版本的备份数据 RESTORE TABLE [db_name.]table_name TO VERSION 'version_id'; 恢复分区表的单个分区数据为指定版本的备份数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

TE BY 1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
查看多版本备份数据 - 数据湖探索 DLI

SHOW HISTORY命令查看表的备份数据。开启和关闭多版本语法请参考开启或关闭数据多版本。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。语法格式查看某个非分区表的备份数据信息 SHOW HISTORY

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

”栏可查看到连接的数据库信息。通过新建的连接即可对DLI执行后续的数据查询相关工作。步骤3：在DBeaver编写SQL查询在DBeaver建立与DLI的连接后，即可在DBeaver编写SQL查询：您可以在左侧的数据库导航面板中选择数据库对象，然后在中间的查询编辑器中编写SQL语句。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Quantile digest函数 - 数据湖探索 DLI

描述：给定0到1之间的数字分位数，返回分位数摘要中的近似百分位值。 values_at_quantiles(qdigest(T), quantiles) -> array(T) 描述：给定一组0到1之间的数字分位数，从分位数摘要中返回对应的近似百分位值组成的数组。 qdigest_agg(x)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

Map 中的空 key 值。示例该示例是从kafka的一个topic中读取数据，并使用kafka sink将数据写入到kafka的另一个topic中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组入向规则，使其对当前将要使用的队列放开

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Upsert Kafka结果表 - 数据湖探索 DLI

流。它会将INSERT/UPDATE_AFTER数据作为正常的Kafka消息写入，并将DELETE数据以value为空的Kafka消息写入（表示对应 key 的消息被删除）。Flink将根据主键列的值对数据进行分区，从而保证主键上的消息有序，因此同一主键上的更新/删除消息将落在同一分区中。前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

default 是常量，默认值为NULL。当offset指定的范围越界时的缺省值，需要与expr对应的数据类型相同。如果expr非常量，则基于当前行进行求值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

使用ogg-json读取kafka中的ogg记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
SORT BY - 数据湖探索 DLI
SORT BY - 数据湖探索 DLI

ASC/DESC：ASC为升序，DESC为降序，默认为ASC。 SORT BY：一般与GROUP BY一起使用，为PARTITION进行单列或多列的局部排序。注意事项所排序的表必须是已经存在的，否则会出错。示例根据字段score对表student在Reducer中进行升序排序。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
lead - 数据湖探索 DLI
lead - 数据湖探索 DLI

default 是常量，默认值为NULL。当offset指定的范围越界时的缺省值，需要与expr对应的数据类型相同。如果expr非常量，则基于当前行进行求值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

添加数据源的相关配置。驱动：上传下载的DLI JDBC驱动。 URL：后面填写DLI jdbc的URL，URL的格式见表2，属性配置项说明见表3。指定数据库： “表结构模式”可填写需访问的数据库名称，如果填写，后续创建数据集时，刷新表，页面上只可见该数据库下的表。如果不填写

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据

总条数： 966

上一页
1
...
18
19
20
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用HetuEngine on Hudi - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

查询HBase表 - 数据湖探索 DLI

last - 数据湖探索 DLI

在DLI控制台删除表 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

DISTRIBUTE BY - 数据湖探索 DLI

恢复多版本备份数据 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

查看多版本备份数据 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

Quantile digest函数 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

lag - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

SORT BY - 数据湖探索 DLI

lead - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线