搜索_华为云

Upsert Kafka源表 - 数据湖探索 DLI

SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 Upsert Kafka 始终以upsert方式工作，并且需要在DDL中定义主键。在具有相同主键值的消息按序存储在同一个分区的前提下，在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用Hive语法创建OBS表 - 数据湖探索 DLI

示例6：创建textfile格式的非分区表，并设置ROW FORMAT 示例说明：创建名为table4的textfile类型的非分区表，并设置ROW FORMAT（ROW FORMAT功能只支持textfile类型的表）。 FIELDS：字段表格中的列，每个字段有一个名称和数据类型，表中字段之间以'/'分隔。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

登录DLI管理控制台，单击“数据管理 > 程序包管理”。在“程序包管理”页面，单击右上角“创建”可创建程序包。在“创建程序包”对话框，配置如下参数：包类型：PyFile。 OBS路径：选择1.aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。在报错的Spark作业编

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Quantile digest函数 - 数据湖探索 DLI

x]) 描述：返回由x的所有输入值（使用每项权重w和最大误差accuracy）组成的qdigest。accuracy必须是一个大于0且小于1的值，并且对于所有输入行是一个常量。父主题： SQL函数和操作符

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建Hive Catalog - 数据湖探索 DLI

e不太可能理解元数据。因此，在Hive中使用这样的表会导致未定义的行为。建议切换到Hive方言来创建Hive兼容表。如果您想用默认的方言创建Hive兼容表，确保在您的表属性中设置'connector'='hive'，否则在HiveCatalog中一个表默认被认为是通用的。如果使

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
OVER - 数据湖探索 DLI
OVER - 数据湖探索 DLI

PARTITION BY：可以用一个或多个键分区。和GROUP BY子句类似，PARTITION BY将表按分区键分区，每个分区是一个窗口，窗口函数作用于各个分区。单表分区数最多允许7000个。 ORDER BY：决定窗口函数求值的顺序。可以用一个或多个键排序。通过ASC或DES

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

egion；专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。详情请参见区域和可用区。可用区一个可用区是一个或多个物理数据中心的集合，有独立的风火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
区域和可用区 - 数据湖探索 DLI

n；专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。可用区（AZ，Availability Zone）：一个AZ是一个或多个物理数据中心的集合，有独立的风火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

) as t(key,value); - {apple=[7, 8, 8], lemon=[5]} 近似值聚合函数在实际情况下，对大量数据进行统计时，有时只关心一个近似值，而非具体值，比如统计某产品的销量，这种时候，近似值聚合函数就很有用，它使用较少的内存和CPU资源，以便可以获

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

队列的描述信息。 cu_count 是 Integer 与队列绑定的最小计算单元个数。设置值当前只支持16，64，256。 charging_mode 否 Integer 队列的收费模式。只能设置为“1”，表示按照CU时收费。 enterprise_project_id 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

而SQL批处理类型的作业在独立的资源池中能够更加灵活地进行扩缩容，显著提升扩缩容的成功率和操作效率。在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。在全天的任意一个时间段内，弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
col - 数据湖探索 DLI
col - 数据湖探索 DLI

col_name_list 格式无。说明字段列表，可由一个或多个col_name构成，多个col_name之间用逗号分隔。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
管理DLI全局变量 - 数据湖探索 DLI

什么是全局变量 DLI支持在管理控制台设置全局变量，将作业开发过程中频繁使用的变量设置为全局变量，可以避免在编辑作业过程中重复定义，减少开发与维护成本。通过使用全局变量可以替换长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。创建全局变量在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

数据，则该分区可以被视为时间表的一个版本，时间表的版本保留了分区的数据。Flink支持在处理时间关联中自动跟踪时间表的最新分区（版本）。最新分区（版本）由 'streaming-source.partition-order' 选项定义。这是在Flink 流应用作业中将 Hive

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

[403] 该报错信息可能是由于OBS桶被设置为了DLI日志桶，而日志桶不能用于DLI的其他业务功能。您可以按以下操作步骤进行查询：检查该OBS桶是否被设置为了DLI日志桶。在DLI管理控制台的“全局配置 > 作业配置” 页查看对应OBS桶是否被设置为了DLI日志桶，日志桶不能用于DLI的其他业务功能中。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Hudi数据表Compaction规范 - 数据湖探索 DLI

划的执行，以及Clean和Archive操作在调度平台（可以使用华为的DataArts）运行一个定时调度的离线任务来让Spark完成Hudi表的Compaction计划执行以及Clean和Archive操作。以SQL作业为例，在配置中添加： hoodie.archive.automatic

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
查询作业详情 - 数据湖探索 DLI

查询作业详情功能介绍查看一个作业的详情信息。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id}/streaming/jobs/{job_id} 参数说明表1 URI参数说明参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

BY 子句是强制的。对于流式查询，Flink 目前只支持 OVER 窗口定义在升序（asc）的时间属性上。其他的排序不支持。 PARTITION BY：OVER 窗口可以定义在一个分区表上。PARTITION BY 子句代表着每行数据只在其所属的数据分区进行聚合。范围（RANGE）

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.forceParti

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

L场景）该示例是从Kafka的一个topic中读取数据，并使用Kafka结果表将数据写入到kafka的另一个topic中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表

总条数： 910

上一页
1
...
6
7
8
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Upsert Kafka源表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

Quantile digest函数 - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

OVER - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

col - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线