搜索_华为云

Hudi数据表Archive规范 - 数据湖探索 DLI

Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。对于Hudi的MOR类型和COW类型的表，都需要开启Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

基准测试的度量单位是每小时执行的查询数( QphH@size)，其中“H”表示每小时系统执行复杂查询的平均次数，“size”表示数据库规模的大小，能够反映出系统在处理查询时的能力。TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数。总而言之，TPC组织颁布的TPC-H

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
UNION - 数据湖探索 DLI
UNION - 数据湖探索 DLI

UNION返回多个查询结果的并集。语法格式 1 select_statement UNION [ALL] select_statement; 关键字 UNION：集合运算，以一定条件将表首尾相接，其中每一个SELECT语句返回的列数必须相同，列的类型和列名不一定要相同。注意事项

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
Upsert Kafka结果表 - 数据湖探索 DLI

功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Upsert Kafka 连接器支持以upsert方式从Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

控制他们对华为云资源的访问范围。例如您的员工中有负责软件开发的人员，您希望他们拥有DLI的使用权限，但是不希望他们拥有删除DLI等高危操作的权限，那么您可以使用IAM为开发人员创建用户，通过授予仅能使用DLI，但是不允许删除DLI的权限策略，控制他们对DLI资源的使用范围。如果

 帮助中心 > 数据湖探索 DLI > 产品介绍
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI Lakehouse表。使用Hive语法创建OBS表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

Checkpoint保存的OBS桶。手工停止Flink作业后，再次启动该Flink作业怎样从指定Checkpoint恢复。解决方案由于Flink Checkpoint和Savepoint生成机制及格式一致，因此可以通过Flink作业列表“操作”列中的“更多 > 导入保存点”，

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

的所有行。在没有ORDER BY的情况下，所有行都被视为对等行，因此未绑定的前导和当前行之间的范围等于未绑定的前导和未绑定的后续之间的范围。例如：下面的查询将salary表中的信息按照每个部门员工工资的大小进行排序。 --创建数据表并插入数据 create table salary

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
UPDATE - 数据湖探索 DLI
UPDATE - 数据湖探索 DLI

参数描述表1 UPDATE参数参数描述 tableIdentifier 在其中执行更新操作的Hudi表的名称。 column 待更新的目标列。 EXPRESSION 需在目标表中更新的源表列值的表达式。 boolExpression 过滤条件表达式。示例 update h0 set

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
右外连接 - 数据湖探索 DLI
右外连接 - 数据湖探索 DLI

OUTER JOIN：返回右表的所有记录，没有匹配值的记录将返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例右外连接和左外连接相似，但是会将右边表（这里的course_info)中的所有记录返回，没有匹配值的左表记录将返回NULL。 1 2

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
在DLI控制台修改数据库所有者 - 数据湖探索 DLI

在“数据管理”页面修改数据库所有者。在管理控制台左侧，单击“数据管理”>“库表管理”。在“库表管理”页面选中需要修改的数据库，单击“操作”栏中的“更多 > 修改数据库”。在弹出的对话框中，输入新的所有者用户名（已存在的用户名），单击“确定”。在“SQL编辑器”页面修改数据库所有者。在管理控制台左侧，单击“SQL编辑器”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
左半连接 - 数据湖探索 DLI
左半连接 - 数据湖探索 DLI

注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。此处的attr_expr_list中所涉及的字段只能是左表中的字段，否则会出错。示例返回选课学生的姓名及其所选的课程编号。 1 2 SELECT student_info.name, student_info

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
Hudi数据表Clean规范 - 数据湖探索 DLI

Clean也是Hudi表的维护操作之一，该操作对于MOR表和COW表都需要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。对于Hudi的MOR、COW表，都需要开启Clean。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

置导入数据的类型，例如将data_type设置为csv。csv数据的具体格式通可过options参数设置，例如：csv的分隔符，转义符等。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
了解数据目录、数据库和表 - 数据湖探索 DLI

设备上的仓库。数据库通常用于存储、检索和管理结构化数据，由多个数据表组成，这些数据表通过键和索引相互关联。表表是数据库最重要的组成部分之一，它由行和列组成。每一行代表一个数据项，每一列代表数据的一个属性或特征。表用于组织和存储特定类型的数据，使得数据可以被有效地查询和分析。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
CREATE DATABASE语句 - 数据湖探索 DLI

EXISTS 如果数据库已经存在，则不会进行任何操作。 WITH OPTIONS 数据库属性一般用于存储关于这个数据库额外的信息。表达式 key1=val1中的键和值都是字符串文本常量。父主题： DDL语法定义

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
CREATE FUNCTION语句 - 数据湖探索 DLI

如果您需要了解创建自定义函数的步骤请参考自定义函数。语法说明 IF NOT EXISTS 若该函数已经存在，则不会进行任何操作。 LANGUAGE JAVA|SCALA Language tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA 和 SCALA，且函数的默认语言为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
配置DLI云服务委托权限 - 数据湖探索 DLI

仅在勾选该权限且更新DLI委托权限后的项目生效。未勾选该权限的项目不具备跨源场景所需权限、和SMN发送通知消息的权限。示例1：在项目A配置DLI的基础使用、跨源场景、运维场景的权限和示例2：在项目B配置DLI的基础使用、跨源场景、运维场景的权限给出了同一个区域的不同项目更新DLI委托带来的委托权限差异。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

源表：源表是Flink作业的数据输入表，例如Kafka等实时流数据输入。维表：数据源表的辅助表，用于丰富和扩展源表的数据。在Flink作业中，因为数据采集端采集到的数据往往比较有限，在做数据分析之前，就要先将所需的维度信息补全，而维表就是代表存储数据维度信息的数据源。常见的用户维表有 MySQL，Redis等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Upsert Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 845

上一页
1
...
14
15
16
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Archive规范 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

UNION - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

UPDATE - 数据湖探索 DLI

右外连接 - 数据湖探索 DLI

在DLI控制台修改数据库所有者 - 数据湖探索 DLI

左半连接 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

CREATE DATABASE语句 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线