搜索_华为云

运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

k 2.3的环境中运行将会报java.lang.AbstractMethodError。解决措施有如下两种方案：基于Spark 2.3重新编译应用使用sl4j+log4j来实现日志功能，而不是直接继承Spark内部接口Logging。具体如下： <dependency>

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
左外连接 - 数据湖探索 DLI
左外连接 - 数据湖探索 DLI

左外连接功能描述根据左表的记录去匹配右表，返回所有左表记录，没有匹配值的记录的返回NULL。语法格式 1 2 SELECT attr_expr_list FROM table_reference LEFT OUTER JOIN table_reference ON join_condition;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

“COUNT”、“SUM”、“AVG”（平均）、“MAX”（最大）和 “MIN”（最小）。对于流式查询，用于计算查询结果的状态可能无限膨胀。状态的大小大多数情况下取决于去重行的数量和分组持续的时间，持续时间较短的 group 窗口不会产生状态过大的问题。可以提供一个合适的状态 time-to-live (TTL)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
右外连接 - 数据湖探索 DLI
右外连接 - 数据湖探索 DLI

右外连接功能描述根据右表的记录去匹配左表，返回所有右表记录，没有匹配值的记录返回NULL。语法格式 1 2 SELECT attr_expr_list FROM table_reference RIGHT OUTER JOIN table_reference ON join_condition;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
正则表达式函数 - 数据湖探索 DLI

有\ n被识别为行终止符。此外，不支持（？d）标志，因此不能使用。大小写区分模式（通过（？i）标志启用）时，总是以unicode的模式去实现。同时，不支持上下文敏感匹配和局部敏感匹配。此外，不支持（？u）标志。不支持Surrogate Pair编码方式。例如，\ uD800

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
提交SQL作业（推荐） - 数据湖探索 DLI

当子查询中数据不重复的情况下，执行关联子查询，不需要对子查询的结果去重。当子查询中数据重复的情况下，执行关联子查询，会提示异常，必须对子查询的结果做去重处理，比如max(),min()。该参数设置为false：不管子查询中数据重复与否，执行关联子查询时，都需要对子查询的结果去重，比如max(),min()，否则提示异常。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
手动续费 - 数据湖探索 DLI
手动续费 - 数据湖探索 DLI

选择续费时长，判断是否勾选“统一到期日”，将到期时间统一到各个月的某一天（详细介绍请参见统一包年/包月资源的到期日）。确认配置费用后单击“去支付”。图1 续费确认进入支付页面，选择支付方式，确认付款，支付订单后即可完成续费。在费用中心续费登录管理控制台。单击“控制台”页

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
数组函数和运算符 - 数据湖探索 DLI

6]);-- [1, 3, 33, 4, 5, 6] array_intersect(x, y) → array 描述：返回两个数组去重后的交集。 select array_intersect(array [1,3,5,7,9],array [1,2,3,4,5]); _col0

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

overwrite这样幂等的语法而不是insert into等非幂等语法插入数据。如果严格需求数据不能重复，建议在insert into后对表数据执行去重操作，防止数据重复。父主题：数据相关

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

cdc-events-duplicate设置为true，并在源表上定义PRIMARY KEY。Framework将生成一个额外的有状态操作符，并使用主键对变更事件进行去重，并生成一个规范化的changelog流。参数说明表1 参数说明参数是否必选默认值类型说明 format 是 (none) String

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

留hoodie.compact.inline.max.delta.commits个Instant不会被归档，以此保证有足够的Instant去触发compation schedule。使用由DLI提供的元数据服务时，本命令不支持使用OBS路径。系统响应可以检查任务状态是否成功

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi的MOR表和COW表都需要保证每天至少1次Archive，MOR表的Archive可以参考2.2.1.6小节和Compaction放在一起异步去执行。COW的Archive可以在写数据时自动判断是否执行。父主题： Hudi数据表管理操作规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

全一致。请选择正确的“服务类型”，本示例中为“RDS”。图1 创建经典型跨源连接-RDS 检查安全组网络（vpc）配置。若按照步骤1重建跨源连接后还是报错“communication link failure”，则检查vpc配置。经典型跨源：入方向规则：检查本安全组内的

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1 Flink作业配置参数对于Flink Jar作业，您需

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Hudi表索引设计规范 - 数据湖探索 DLI

避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法平衡Bueckt桶过大的问题，还是可以继续采用Flink状态索引，按照规范去优化对应的配置参数即可。建议基于Flink的流式写入的表，在数据量超过2亿条记录，采用Bucket索引，2亿以内可以采用Flink状态索引。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi数据表Compaction规范 - 数据湖探索 DLI

空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致Spark任务耗时长并且也会导致下游的读作业时延高。对此场景，在这里给出以下建议：按照集群资源使用情况，可以每2小时或每4个小时去调度执行一次异步Compaction作业，这是一个基本的维护MOR表的方案。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

设置成true，并在该source上定义PRIMARY KEY。框架会生成一个额外的有状态算子，使用该primary key来对变更事件去重并生成一个规范化的changelog流。更新信息请参考Debezium 官方文档。消费Debezium Postgres Connector产生的数据

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi的MOR表和COW表都需要保证每天至少1次Clean，MOR表的Clean可以参考2.2.1.6小节和Compaction放在一起异步去执行。COW的Clean可以在写数据时自动判断是否执行。父主题： Hudi数据表管理操作规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

ction.async.enabled = fasle），需要设置为false，采用异步clean。建议和Compaction放在一起异步去执行 hoodie.archive.automatic 否 true String COW表：设置为true MOR表，且默认开启异步压缩时（compaction

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

5日订购的套餐包，之后每个月5日同一时间重置免费资源。按自然周期重置：结合重置周期使用，如重置周期为月，且按自然周期重置，即每月1日0点重置免费资源。 DLI的套餐包中仅存储套餐包按自然周期重置，即每小时重置，其他套餐包按订购周期重置。适用场景通常情况下，建议您针对不同的业务创建项目：

帮助中心 > 数据湖探索 DLI > 计费说明

总条数： 73

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

左外连接 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

右外连接 - 数据湖探索 DLI

正则表达式函数 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

手动续费 - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线