搜索_华为云

Postgres CDC源表 - 数据湖探索 DLI

Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 PostgreSQL的版本不能低于PostgreSQL 11。若Postgres表有update等操作，需要在PostgreSQL中执行下列语句。注意：test.cd

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

100.00,100.00,2021-03-24 10:02:03,0001,Alice,330106) 常见问题 Q：Flink作业运行失败，作业运行日志中如下报错信息，应该怎么解决？ java.lang.IllegalArgumentException: offset (0)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
创建DLI自定义委托权限 - 数据湖探索 DLI

3及以上版本的引擎执行作业时，需要在作业配置中添加新建的委托信息。否则Spark3.3.1作业不指定委托时，无法使用OBS；Flink1.15作业不指定委托时，无法开启checkpoint、savepoint，作业提交日志无法转储，无法使用OBS、DWS等数据源。仅有运行在弹性资源池队列上的Flink 1.15和Spark3

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

窗口聚合中 GROUP BY 子句必须包含 window_start 和 window_end 列，但 GROUPING SETS 子句中不能包含这两个字段。 Flink SQL> SELECT window_start, window_end, supplier_id, SUM(price)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

return print(status) 取消作业 DLI提供取消作业的接口。您可以使用该接口取消已经提交的作业，若作业已经执行结束或失败则无法取消。示例代码如下： 1 2 3 4 5 6 def cancel_sql(dli_client, job_id): try:

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
队列属性设置 - 数据湖探索 DLI

driver实例数”不生效。开启“作业结果保存策略”，即配置作业结果保存至DLI作业桶后，请务必在提交SQL作业前配置DLI作业桶信息，否则SQL作业可能会提交失败。设置队列属性操作步骤在DLI管理控制台的左侧导航栏中，单击“资源管理 > 队列管理”。在对应队列的“操作”列，选择“更多 > 属性设置”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
HAVING - 数据湖探索 DLI
HAVING - 数据湖探索 DLI

等式操作符，及IN，NOT IN操作符。注意事项所要查询的表必须是已经存在的表，否则会出错。此处的sub_query与聚合函数的位置不能左右互换。示例对表student_info按字段name进行分组，计算每组中记录数，若其记录数等于子查询中表course_info的记

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
DWS源表（不推荐使用） - 数据湖探索 DLI

境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据 with参数中字段只能使用单引号，不能使用双引号。语法格式 1 2 3 4 5 6 7 8 9 10 11 12 13 create table dwsSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
新建Flink Jar作业 - 数据湖探索 DLI

数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 标签的值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格。响应消息表4 响应参数说明参数名称

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查看弹性资源池的基本信息 - 数据湖探索 DLI

实际CUs的计算公式：实际CUs=min{sum（队列maxCU）,弹性资源池maxCU}。计算结果需满足为16CUs的倍数，如果不能整除16CUs则向上取整。实际CUs的分配示例：如表1所示，弹性资源池实际CUs分配的计算过程如下：计算队列maxCU之和：sum（队列maxCU）=

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消息进行过滤，则可以考虑先实时接入生成offset，再truncate table ，再历史导入，再开启实时。图1 初始化操作流程

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

之间的比较）。系统采样中行的选择依赖于使用的connector。例如，如果使用Hive数据源，这将取决于数据在OBS上的布局。这种采样方法不能保证独立的抽样概率。 SELECT * FROM users TABLESAMPLE SYSTEM (75); 父主题： DQL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Flink作业，提供了更高的灵活性和自定义能力，适合需要进行复杂数据处理的场景。当社区版Flink提供的Connector不能满足特定需求时，用户可以通过Jar作业来实现自定义的Connector或数据处理逻辑。适合需要实现UDF（用户定义函数）或特定库集成的场

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
创建表时指定表的生命周期 - 数据湖探索 DLI

生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。生命周期设置后，DLI表和OBS表支持数据备份，OBS表的备份目录需要手工设置。且备份目录应选择在并行文件系统上，备份目录必须和原表目录在同一个桶上，备份目录不能与原表相同目录或者子目录同名。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

会按照 FROM 中所定义的顺序依次执行。请确保 join 所指定的表在顺序执行中不会产生不支持的 cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

会按照 FROM 中所定义的顺序依次执行。请确保 join 所指定的表在顺序执行中不会产生不支持的 cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。根据该验证方式，初步定位是因为文件数据量较大，文本编辑器无法全部读取。通过执行查询语句，查询OBS数据进一步进行确认，查询结果确认数据量正确。因此，该问题为验证方式不正确造成。参考信息插入数

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI Delta常见问题 - 数据湖探索 DLI

a low retention period? 根因分析：RETAIN 保留期过短（少于168小时），需要确认是否能清理该时间前的数据，将无法再回头查看在指定数据保留期之前创建的版本。确认清理可在console页面设置中添加参数spark.databricks.delta.retentionDurationCheck

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
FileSytem结果表 - 数据湖探索 DLI

file-path' = '', 'format.type' = '' ); 注意事项该建表语法的数据输出目录为OBS时，OBS必须为并行文件系统，不能为OBS桶。使用fileSystem时必须开启checkpoint，保证作业的一致性。 format.type为parquet时，支持的数据类型为string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
管理DLI全局变量 - 数据湖探索 DLI

用户均可删除该全局变量。变量删除后，SQL中将无法使用该变量。全局变量权限管理针对不同用户，可以通过权限设置分配不同的全局变量，不同用户之间互不影响。管理员用户和全局变量的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其全局变量权限。给新用户设置全局变量权限时，

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作

总条数： 494

上一页
1
...
18
19
20
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Postgres CDC源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

队列属性设置 - 数据湖探索 DLI

HAVING - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

Flink作业概述 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

DLI Delta常见问题 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线