搜索_华为云

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。

帮助中心 > 数据湖探索 DLI > 快速入门
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关完整样例代码和依赖包说明请参考：Python SDK概述。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Hudi数据表Compaction规范 - 数据湖探索 DLI

on Plan没有去执行而导致Spark任务耗时长并且也会导致下游的读作业时延高。对此场景，在这里给出以下建议：按照集群资源使用情况，可以每2小时或每4个小时去调度执行一次异步Compaction作业，这是一个基本的维护MOR表的方案。采用Spark异步执行Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

客户在DLI中创建了DWS跨源连接和DWS跨源表，然后对DWS中的源表schema进行更新，执行DLI作业，发现DWS中源表schema被修改为更新前的形式，导致schema不匹配，作业执行失败。原因分析 DLI跨源表执行insert操作时，会将DWS源表删除重建，客户没有对应更新DLI端跨源表建表语句，导致更新的DWS源表被替换。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Spark开源命令支持说明 - 数据湖探索 DLI

lePath' partitioned by (dt string) row format delimited fields terminated by ',' STORED as TEXTFILE; 支持支持插入测试数据 insert into table testDB.testTable2

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

ards' [PARTITION (partition_spec)] 描述用于展示表或分区的详细信息。可以使用规则运算表达式来同时匹配多个表，但不可用于匹配分区。展示的信息将包括表的基本信息和相关的文件系统信息，其中文件系统信息包括总文件数、总文件大小、最大文件长度、最小文

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

且范围必须大于并行度。在增量快照读取过程中，MySQL CDC Source 首先通过表的主键将表划分成多个块（chunk），然后 MySQL CDC Source 将多个块分配给多个 reader 以并行读取表的数据。无锁算法 MySQL CDC source 使用增量快照算法

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择Spark版本为2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

是 log_file_path_pattern log file的路径，支持正则匹配否 merge 执行show_logfile_records时，通过merge控制是否将多个log file中的record合并在一起返回否 limit 限制返回结果的条数否示例 call

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。

帮助中心 > 数据湖探索 DLI > 快速入门
查看弹性资源池的基本信息 - 数据湖探索 DLI

弹性资源池 64-112CUs 队列A 16-32CUS 队列B 16-56CUS 已使用CUs：已经被作业或任务占用的CU资源。这些资源可能正在执行计算任务，暂时不可用。 HetuEngine已使用CUs和实际CU一致。 CU范围：CU设置主要是为了控制弹性资源池扩缩容的最大最小CU范围，避免无限制的资源扩容风险。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

consume.end.timestamp=20210308212318 // 指定增量拉取结束commit，如果不指定的话采用最新的commit 随后执行SQL select * from tableName where `_hoodie_commit_time`>'20201227153030'

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
FileSystem结果表 - 数据湖探索 DLI

为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
按列GROUP BY - 数据湖探索 DLI
按列GROUP BY - 数据湖探索 DLI

BY子句中仅包含一列，col_name_list中包含的字段必须出现在attr_expr_list的字段内，attr_expr_list中可以使用多个聚合函数，比如count()，sum()，聚合函数中可以包含其他字段。多列GROUP BY：指GROUP BY子句中不止一列，查询语句将按照GROUP

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

务服务的专用Region。详情请参见区域和可用区。可用区一个可用区是一个或多个物理数据中心的集合，有独立的风火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。项目区域默认

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递操作场景如果您的自定义函数需要在多个作业中使用，但对于不同作业某些参数值不同，直接在UDF中修改较为复杂。您可以在Flink OpenSource SQL编辑页面，自定义配置中配置参数pipeline.global-job-parameters，在UDF代码

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递操作场景如果您的自定义函数需要在多个作业中使用，但对于不同作业某些参数值不同，直接在UDF中修改较为复杂。您可以在Flink OpenSource SQL编辑页面，自定义配置中配置参数pipeline.global-job-parameters，在UDF代码

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
UNNEST - 数据湖探索 DLI
UNNEST - 数据湖探索 DLI

UNNEST可以将ARRAY或MAP展开成relation。ARRAYS展开为单独一列，MAP展开为两列（key，value）。UNNEST还可以与多个参数一起使用，将被展开成多列，行数与最高基数参数相同（其他列用空填充）。UNNEST可以选择使用WITH ORDINALITY子句，在这种

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Postgres CDC源表 - 数据湖探索 DLI

Schema名称。 Schema名称支持正则表达式以读取多个Schema的数据，例如test(.)*表示以test开头的所有schema。 table-name 是无 String Postgres表名。表名支持正则表达式去读取多个表的数据，例如cdc_order(.)*表示以cdc_order开头的所有表。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

10:15:00开始生效，且首次执行调度的时间是2024/11/22 10:20:00，调度周期建个1天，即后续每天10:20:00 AM会自动调度这些这个作业，会按照编排好的pipeline顺序执行作业中的每个节点。图17 配置作业调度依次单击 “保存” 、“提交” 和 “执行调度” 按钮，即可完成作业周期调度配置。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 616

上一页
1
...
7
8
9
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

按列GROUP BY - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

UNNEST - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线