搜索_华为云

运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

lang.AbstractMethodError。解决措施有如下两种方案：基于Spark 2.3重新编译应用使用sl4j+log4j来实现日志功能，而不是直接继承Spark内部接口Logging。具体如下： <dependency> <groupId>org.slf4j</groupId>

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

通过DLI样例代码获取。该样例代码的目录内容介绍如下： dli-flink-demo：开发Flink作业时的样例代码参考。例如，样例代码实现读取Kafka源表数据写入到HDFS、DWS、Hive等结果表中的功能。 dli-spark-demo：开发Spark作业时的样例代码参考。具体如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

创建一个Kafka源表，用来从Kafka指定Topic中读取消费数据；创建一个结果表，用来通过JDBC向MySQL中写入结果数据。实现相应的处理逻辑，以实现各个指标的统计。为了简化最终的处理逻辑，使用创建视图进行数据预处理。利用over窗口条件和过滤条件结合以去除重复数据（该方式是利用了top

帮助中心 > 数据湖探索 DLI > 最佳实践
使用HetuEngine on Hudi - 数据湖探索 DLI

使用HetuEngine on Hudi HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine对Hudi仅支持select操

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业操作场景华为云数据治理中心DataArts Studio提供了一站式数据治理平台，可以实现与DLI服务的对接，从而提供统一的数据集成、数据开发服务，方便企业对全部数据进行管控。本节操作介绍在DataArts Studio开发DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
左半连接 - 数据湖探索 DLI
左半连接 - 数据湖探索 DLI

SEMI JOIN：只显示左表中的记录。可通过在LEFT SEMI JOIN， WHERE...IN和WHERE EXISTS中嵌套子查询来实现。左半连接与左外连接的区别是，左半连接将返回左表中符合JOIN条件的记录，而左外连接将返回左表所有的记录，匹配不上JOIN条件的记录将返回NULL值。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
隐式连接 - 数据湖探索 DLI
隐式连接 - 数据湖探索 DLI

table_reference.col_name = table_reference.col_name; 关键字 WHERE：隐式连接利用WHERE条件实现类似JOIN...ON...的连接，返回匹配的记录。语法格式中仅给出等式条件下的WHERE条件过滤，同时也支持不等式WHERE条件过滤。注意事项

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
Flink作业推荐配置指导 - 数据湖探索 DLI

Flink作业推荐配置指导用户在创建Flink作业时，可以通过如下配置实现流应用的高可靠性能。用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。图1 创建主题图2

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
管理Spark作业模板 - 数据湖探索 DLI

管理Spark作业模板操作场景在创建Spark作业时，您可以在已有的Spark样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。当前云平台尚未提供预置的Spark模板，但支持用户自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入如果需要将数据插入到表中，但只想指定部分字段，可以使用INSERT INTO语句结合SELECT子句来实现。但是DLI目前不支持直接在INSERT INTO语句中指定部分列字段进行数据插入，您需要确保在SELECT子句中选择的字段数量和类型与

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
管理Flink作业模板 - 数据湖探索 DLI

管理Flink作业模板 Flink模板包括样例模板和自定义模板。用户可以在已有的样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。也可以根据自己的习惯和方法自定义作业模板，方便后续可以直接调用或修改。 Flink模板管理主要包括如下功能： Flink SQL样例模板

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

编写UDAF函数代码。UDAF函数实现，主要注意以下几点：自定义UDAF需要继承org.apache.hadoop.hive.ql.exec.UDAF和org.apache.hadoop.hive.ql.exec.UDAFEvaluator类。函数类需要继承UDAF类，计算类Evaluator实现UDAFEvaluator接口。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
正则表达式函数 - 数据湖探索 DLI

\ n被识别为行终止符。此外，不支持（？d）标志，因此不能使用。大小写区分模式（通过（？i）标志启用）时，总是以unicode的模式去实现。同时，不支持上下文敏感匹配和局部敏感匹配。此外，不支持（？u）标志。不支持Surrogate Pair编码方式。例如，\ uD800 \

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

DLI提供的增强型跨源连接功能，底层采用对等连接的方式打通与目的数据源的vpc网络，通过点对点的方式实现数据互通。图1 增强型跨源连接配置流程配置DLI队列与公网网络连通通过配置SNAT规则，添加到公网的路由信息，可以实现队列到和公网的网络打通。图2 配置DLI队列访问公网流程父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
配置SQL防御规则 - 数据湖探索 DLI

低质量的SQL会对数据分析平台系统带来不可预料的冲击，影响系统的性能或者平台稳定性。 DLI在Spark SQL引擎中增加SQL防御能力，基于用户可理解的SQL防御策略，实现对典型大SQL、低质量SQL的主动防御，包括事前提示、拦截和事中熔断，并不强制改变用户的SQL提交方式、SQL语法，对业务零改动且易落地。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告公告说明为了更好的实现资源共享，提高计算资源利用率，DLI将“包年/包月”和“按需计费”计费模式队列升级为“弹性资源池队列”。即使用DLI计算资源需先购买弹性资源池，并在弹性资源池中创建队列。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
创建增强型跨源连接 - 数据湖探索 DLI

询、分析其他数据源的数据。例如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和对应数据源VPC之间的网络，才能实现数据互通。本节操作介绍在控制台创建增强型跨源连接的操作步骤。约束和限制表1 增强型跨源连接约束限制限制项说明适用场景约束限制

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

a、DWS时，需要打通DLI和外部数据源之间的网络。使用DLI提供的增强型跨源连接，采用对等连接的方式打通DLI与目的数据源的VPC网络，实现数据互通。本节操作介绍适用增强型跨源连接配置DLI与内网数据源的网络联通的操作指导。创建增强型跨源连接网络不通的问题，可以根据本指导的整体流程和步骤进行排查验证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？可以使用OBS跨区域复制功能实现，步骤如下：将区域一中的DLI表数据导出到自定义的OBS桶中。具体请参考《数据湖探索用户指南》。通过OBS跨区域复制功能将数据复制至区域二的OBS桶中。具体请参考跨区域复制。根据需要导入或使用对应的数据。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启）操作场景本节操作介绍创建Flink作业时，配置流应用实现高可靠性能的操作方法。操作步骤用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发

总条数： 132

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

使用HetuEngine on Hudi - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

左半连接 - 数据湖探索 DLI

隐式连接 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

正则表达式函数 - 数据湖探索 DLI

怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线