搜索_华为云

MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

且范围必须大于并行度。在增量快照读取过程中，MySQL CDC Source 首先通过表的主键将表划分成多个块（chunk），然后 MySQL CDC Source 将多个块分配给多个 reader 以并行读取表的数据。无锁算法 MySQL CDC source 使用增量快照算法

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

客户在DLI中创建了DWS跨源连接和DWS跨源表，然后对DWS中的源表schema进行更新，执行DLI作业，发现DWS中源表schema被修改为更新前的形式，导致schema不匹配，作业执行失败。原因分析 DLI跨源表执行insert操作时，会将DWS源表删除重建，客户没有对应更新DLI端跨源表建表语句，导致更新的DWS源表被替换。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
预览SQL作业查询结果 - 数据湖探索 DLI

预览SQL作业查询结果功能介绍该API用于在执行SQL查询语句的作业完成后，查看该作业执行的结果。目前仅支持查看“QUERY”类型作业的执行结果。该API只能查看前1000条的结果记录，且不支持分页查询。若要查看全部的结果记录，需要先导出查询结果再进行查看，详细请参见导出查询结果。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

问题出现时Flink读取的时间和RDS数据库的时间会相差13小时。请在RDS数据库内执行如下语句 show variables like '%time_zone%' 执行结果如下：图1 执行结果表1 参数说明参数说明 system_time_zone 数据库时区。这里它指向

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

ards' [PARTITION (partition_spec)] 描述用于展示表或分区的详细信息。可以使用规则运算表达式来同时匹配多个表，但不可用于匹配分区。展示的信息将包括表的基本信息和相关的文件系统信息，其中文件系统信息包括总文件数、总文件大小、最大文件长度、最小文

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Spark SQL常用配置项说明 - 数据湖探索 DLI

该参数设置为true：当子查询中数据不重复的情况下，执行关联子查询，不需要对子查询的结果去重。当子查询中数据重复的情况下，执行关联子查询，会提示异常，必须对子查询的结果做去重处理，比如max(),min()。该参数设置为false：不管子查询中数据重复与否，执行关联子查询时，都需要对子查询的结果去重，比如max()

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Hudi数据表Compaction规范 - 数据湖探索 DLI

on Plan没有去执行而导致Spark任务耗时长并且也会导致下游的读作业时延高。对此场景，在这里给出以下建议：按照集群资源使用情况，可以每2小时或每4个小时去调度执行一次异步Compaction作业，这是一个基本的维护MOR表的方案。采用Spark异步执行Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。

帮助中心 > 数据湖探索 DLI > 快速入门
Spark开源命令支持说明 - 数据湖探索 DLI

lePath' partitioned by (dt string) row format delimited fields terminated by ',' STORED as TEXTFILE; 支持支持插入测试数据 insert into table testDB.testTable2

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

是 log_file_path_pattern log file的路径，支持正则匹配否 merge 执行show_logfile_records时，通过merge控制是否将多个log file中的record合并在一起返回否 limit 限制返回结果的条数否示例 call

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。

帮助中心 > 数据湖探索 DLI > 快速入门
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关完整样例代码和依赖包说明请参考：Python SDK概述。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
查看弹性资源池的基本信息 - 数据湖探索 DLI

弹性资源池 64-112CUs 队列A 16-32CUS 队列B 16-56CUS 已使用CUs：已经被作业或任务占用的CU资源。这些资源可能正在执行计算任务，暂时不可用。 HetuEngine已使用CUs和实际CU一致。 CU范围：CU设置主要是为了控制弹性资源池扩缩容的最大最小CU范围，避免无限制的资源扩容风险。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

务服务的专用Region。详情请参见区域和可用区。可用区一个可用区是一个或多个物理数据中心的集合，有独立的风火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。项目区域默认

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递操作场景如果您的自定义函数需要在多个作业中使用，但对于不同作业某些参数值不同，直接在UDF中修改较为复杂。您可以在Flink OpenSource SQL编辑页面，自定义配置中配置参数pipeline.global-job-parameters，在UDF代码

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递操作场景如果您的自定义函数需要在多个作业中使用，但对于不同作业某些参数值不同，直接在UDF中修改较为复杂。您可以在Flink OpenSource SQL编辑页面，自定义配置中配置参数pipeline.global-job-parameters，在UDF代码

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
按列GROUP BY - 数据湖探索 DLI
按列GROUP BY - 数据湖探索 DLI

BY子句中仅包含一列，col_name_list中包含的字段必须出现在attr_expr_list的字段内，attr_expr_list中可以使用多个聚合函数，比如count()，sum()，聚合函数中可以包含其他字段。多列GROUP BY：指GROUP BY子句中不止一列，查询语句将按照GROUP

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

consume.end.timestamp=20210308212318 // 指定增量拉取结束commit，如果不指定的话采用最新的commit 随后执行SQL select * from tableName where `_hoodie_commit_time`>'20201227153030'

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
FileSystem结果表 - 数据湖探索 DLI

为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
UNNEST - 数据湖探索 DLI
UNNEST - 数据湖探索 DLI

UNNEST可以将ARRAY或MAP展开成relation。ARRAYS展开为单独一列，MAP展开为两列（key，value）。UNNEST还可以与多个参数一起使用，将被展开成多列，行数与最高基数参数相同（其他列用空填充）。UNNEST可以选择使用WITH ORDINALITY子句，在这种

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法

总条数： 619

上一页
1
...
7
8
9
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MySql CDC - 数据湖探索 DLI

更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

预览SQL作业查询结果 - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

按列GROUP BY - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

UNNEST - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线