搜索_华为云

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

init函数。 iterate接收传入的参数，并进行内部的迭代。 terminatePartial无参数，其为iterate函数遍历结束后，返回遍历得到的数据，terminatePartial类似于 hadoop的Combiner。 merge接收terminatePartial的返回结果。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

--********************************************************************-- -- 临时中间表 --********************************************************************--

帮助中心 > 数据湖探索 DLI > 最佳实践
DLI请求条件 - 数据湖探索 DLI
DLI请求条件 - 数据湖探索 DLI

务特定的条件键。表1 DLI请求条件 DLI条件键类型运算符描述 g:CurrentTime 全局级 Date and time 接收到鉴权请求的时间。说明：以“ISO 8601”格式表示，例如：2012-11-11T23:59:59Z。 g:MFAPresent 全局级

 帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

表示按'streaming-source.partition.order'的顺序读取最新的分区。 Flink 支持对最新的 hive 分区进行临时连接，通过启用 'streaming-source.enable'，并将 'streaming-source.partition.include'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

不断写入，向Hive添加新数据，以增量方式提交记录使其可见。用户控制何时/如何触发具有多个属性的提交。流式写入不支持插入覆盖。有关可用配置的完整列表，请参阅流式处理接收器。Streaming sink 前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

指定读取的hudi表路径 .createTempView("hudi_incremental_temp_view"); // 注册为spark临时表 // 结果必须根据startTime和endTime进行过滤，如果没有指定endTime，则只需要根据startTime进行过滤

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

内容复制到基础镜像中 USER omm 其中，主要包含了以下步骤：设置pip的可用仓库地址。使用pip3安装tensorflow算法包。将安装了算法包的临时镜像builder里的内容复制到基础镜像中（这一步主要是为了减小镜像体积），用于生成最终的自定义镜像。利用Dockerfile生成自定义镜像。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

properties) 插入数据前：插入数据后：使用上述read.format()或者read.jdbc()方法读取到的dateFrame注册为临时表，就可使用sql语句进行数据查询了。 1 2 jdbcDF.registerTempTable("customer_test") sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

新建Java Class文件步骤4：编写代码编写SparkDemoObs程序读取OBS桶下的1的“people.json”文件，并创建和查询临时表“people”。完整的样例请参考完整样例代码参考，样例代码分段说明如下：导入依赖的包。 import org.apache.spark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

properties) 插入数据前：插入数据后：使用上述read.format()或者read.jdbc()方法读取到的dataFrame注册为临时表，就可使用sql语句进行数据查询了。 1 2 jdbcDF.registerTempTable("customer_test") sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
DLI经典型跨源连接下线（EOL）公告 - 数据湖探索 DLI

实现DLI与数据源的VPC网络互通，为DLI的跨源分析提供了支持。目前DLI支持跨源访问的数据源请参考跨源分析开发方式。增强型跨源连接收费吗？增强型跨源连接不计费。怎样创建增强型跨源连接？在DLI管理控制台，单击“跨源管理 > 增强型跨源 ”。选择“增强型跨源”，单击“创建”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI作业开发流程 - 数据湖探索 DLI

构，不需要事先定义元数据。定义您的数据结构，包括数据目录、数据库、表。请参考创建数据库和表。创建必要的存储桶来存储作业运行过程中产生的临时数据：作业日志、作业结果等。请参考配置DLI作业桶。配置元数据的访问权限。请参考在DLI控制台配置数据库权限、在DLI控制台配置表权限。

帮助中心 > 数据湖探索 DLI > 用户指南
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

Flink SQL 系统中。在许多情况下，这对于利用此功能很有用。例如：将数据库中的增量数据同步到其他系统审计日志数据库的实时物化视图临时连接更改数据库表的历史等等。 Flink 还支持将 Flink SQL 中的 INSERT/UPDATE/DELETE 消息编码为 Maxwell

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

子句可用于在 SELECT 子句之外定义 OVER 窗口。它让查询可读性更好，也允许多个聚合共用一个窗口定义。示例查询为每个订单计算前一个小时之内接收到的同一产品所有订单的总金额。 1 2 3 4 5 6 7 SELECT order_id, order_time, amount, SUM(amount)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
查看Flink作业详情 - 数据湖探索 DLI

查看Flink作业任务列表用户可以查看作业运行时每个任务的详细信息，例如任务的开始时间、收发字节数和运行时长等。如果数据为零，表示没有从数据源接收到数据。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入Flink作业管理页面。单击需要查看的作业名称，进入“作业详情”页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink作业性能调优 - 数据湖探索 DLI

1以下为OK，0.1到0.5为LOW，超过0.5则为HIGH。时延 Source端会周期性地发送带当前时间戳的LatencyMarker，下游算子接收到该标记后，通过当前时间减去标记中带的时间戳的方式，计算时延指标。算子的反压状态和时延可以通过Flink UI或者作业任务列表查看，一般情况下反压和高时延成对出现：

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Elasticsearch结果表 - 数据湖探索 DLI

的异步处理。 sink.bulk-flush.backoff.strategy 否 DISABLED String 指定在任何刷新操作由于临时请求错误而失败时如何执行重试。有效的策略是： DISABLED：未执行重试，即在第一个请求错误后失败。 CONSTANT：等待重试之间的退避延迟。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

间隔设置允许对缓冲操作进行完全异步处理。 sink.bulk-flush.backoff.strategy 否 DISABLED String 指定在由于临时请求错误导致任何 flush 操作失败时如何执行重试。有效策略为： DISABLED：不执行重试，即第一次请求错误后失败。 CONSTANT：等待重试之间的回退延迟。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

度和相关操作。环境准备 DLI资源环境准备配置DLI作业桶使用DLI服务前需配置DLI作业桶，该桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。具体操作请参考：配置DLI作业桶。创建弹性资源池并添加SQL队列弹性资源池为DLI作业运行提供所需的计

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI自定义策略 - 数据湖探索 DLI

务特定的条件键。表1 DLI请求条件 DLI条件键类型运算符描述 g:CurrentTime 全局级 Date and time 接收到鉴权请求的时间。说明：以“ISO 8601”格式表示，例如：2012-11-11T23:59:59Z。 g:MFAPresent 全局级

 帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理

总条数： 67

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

DLI请求条件 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DLI经典型跨源连接下线（EOL）公告 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线