搜索_华为云

Spark Jar作业开发指南 - 数据湖探索 DLI

使用Spark作业访问DLI元数据使用Spark作业跨源访问数据源 Spark Jar 使用DEW获取访问凭证读写OBS 获取Spark作业委托临时凭证用于访问其他云服务

 帮助中心 > 数据湖探索 DLI > 开发指南
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

--每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3 ); CREATE TABLE jdbcSink

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

SQL使用DEW管理访问凭据。 Flink Jar 作业使用固定AKSK访问OBS、Flink Jar 获取委托的临时AKSK、Flink SQL UDF 获取委托的临时AKSK场景。请参考Flink作业委托场景开发指导。 Flink 1.15 Jar 读取用户自定义配置文件的方式相比Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
自定义函数参数传递 - 数据湖探索 DLI

'1', --每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3 ); create table printSink(message

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

'1', --每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3 ); create table printSink(message

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

--每秒生成一条数据\r\n 'fields.name.kind' = 'random', --为字段user_id指定random生成器\r\n 'fields.name.length' = '5' --限制user_id长度为3\r\n);\r\n \r\nCREATE

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

Table，processing-time temporal join始终会加入最新版本的时态表。Flink支持分区表和 Hive非分区表的临时连接，对于分区表，Flink 支持自动跟踪Hive表的最新分区。详情可参考：Apache Flink Hive Read & Write 注意事项

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

--********************************************************************-- -- 临时中间表 --********************************************************************--

帮助中心 > 数据湖探索 DLI > 最佳实践
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

表示按'streaming-source.partition.order'的顺序读取最新的分区。 Flink 支持对最新的 hive 分区进行临时连接，通过启用 'streaming-source.enable'，并将 'streaming-source.partition.include'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
状态码 - 数据湖探索 DLI
状态码 - 数据湖探索 DLI

状态码状态码如表1所示。表1 状态码状态码编码状态码说明 100 Continue 继续请求。这个临时响应用来通知客户端，它的部分请求已经被服务器接收，且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。例如，切换到HTTP的新版本协议。

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

内容复制到基础镜像中 USER omm 其中，主要包含了以下步骤：设置pip的可用仓库地址。使用pip3安装tensorflow算法包。将安装了算法包的临时镜像builder里的内容复制到基础镜像中（这一步主要是为了减小镜像体积），用于生成最终的自定义镜像。利用Dockerfile生成自定义镜像。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

新建Java Class文件步骤4：编写代码编写SparkDemoObs程序读取OBS桶下的1的“people.json”文件，并创建和查询临时表“people”。完整的样例请参考完整样例代码参考，样例代码分段说明如下：导入依赖的包。 import org.apache.spark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

properties) 插入数据前：插入数据后：使用上述read.format()或者read.jdbc()方法读取到的dateFrame注册为临时表，就可使用sql语句进行数据查询了。 1 2 jdbcDF.registerTempTable("customer_test") sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

Flink SQL 系统中。在许多情况下，这对于利用此功能很有用。例如：将数据库中的增量数据同步到其他系统审计日志数据库的实时物化视图临时连接更改数据库表的历史等等。 Flink 还支持将 Flink SQL 中的 INSERT/UPDATE/DELETE 消息编码为 Maxwell

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

properties) 插入数据前：插入数据后：使用上述read.format()或者read.jdbc()方法读取到的dataFrame注册为临时表，就可使用sql语句进行数据查询了。 1 2 jdbcDF.registerTempTable("customer_test") sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
DLI作业开发流程 - 数据湖探索 DLI

构，不需要事先定义元数据。定义您的数据结构，包括数据目录、数据库、表。请参考创建数据库和表。创建必要的存储桶来存储作业运行过程中产生的临时数据：作业日志、作业结果等。请参考配置DLI作业桶。配置元数据的访问权限。请参考在DLI控制台配置数据库权限、在DLI控制台配置表权限。

帮助中心 > 数据湖探索 DLI > 用户指南
DLI弹性资源池与队列简介 - 数据湖探索 DLI

务场景。全局共享模式 default队列多用户多队列共享资源按量付费，不支持预留资源适合不确定数据量大小或仅需要偶尔进行数据处理的临时或测试项目场景。非弹性资源池模式（废弃，不推荐使用） SQL队列通用队列单用户单队列独享资源无法动态调整，资源可能会闲置废弃，不推荐使用

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

指定读取的hudi表路径 .createTempView("hudi_incremental_temp_view"); // 注册为spark临时表 // 结果必须根据startTime和endTime进行过滤，如果没有指定endTime，则只需要根据startTime进行过滤

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

间隔设置允许对缓冲操作进行完全异步处理。 sink.bulk-flush.backoff.strategy 否 DISABLED String 指定在由于临时请求错误导致任何 flush 操作失败时如何执行重试。有效策略为： DISABLED：不执行重试，即第一次请求错误后失败。 CONSTANT：等待重试之间的回退延迟。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Elasticsearch结果表 - 数据湖探索 DLI

的异步处理。 sink.bulk-flush.backoff.strategy 否 DISABLED String 指定在任何刷新操作由于临时请求错误而失败时如何执行重试。有效的策略是： DISABLED：未执行重试，即在第一个请求错误后失败。 CONSTANT：等待重试之间的退避延迟。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表

总条数： 64

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Jar作业开发指南 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

状态码 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线