搜索_华为云

在Spark SQL作业中使用UDF - 数据湖探索 DLI

在Spark SQL作业中使用UDF 操作场景 DLI支持用户使用Hive UDF（User Defined Function，用户定义函数）进行数据查询等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

Ogg Format 功能描述 Oracle GoldenGate (a.k.a ogg) 是一个实现异构 IT 环境间数据实时数据集成和复制的综合软件包。该产品集支持高可用性解决方案、实时数据集成、事务更改数据捕获、运营和分析企业系统之间的数据复制、转换和验证。Ogg 为变更日志提供了统一的格式结构，并支持使用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据操作场景 DLI完全兼容开源的Apache Spark，支持用户开发应用程序代码来进行作业数据的导入、查询以及分析处理。本示例从编写Spark程序代码读取和查询OBS数据、编译打包到提交Spark Jar作业等完整的操作步骤说明来帮助您在DLI上进行作业开发。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

创建Spark作业 Spark作业编辑页面支持执行Spark作业，为用户提供全托管式的Spark计算服务。在总览页面，单击Spark作业右上角的“创建作业”，或在Spark作业管理页面，单击右上角的“创建作业”，均可进入Spark作业编辑页面。进入Spark作业编辑页面，页面

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
创建弹性资源池并添加队列 - 数据湖探索 DLI

创建弹性资源池并添加队列弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF 操作场景 DLI支持用户使用Hive UDTF（User-Defined Table-Generating Functions）自定义表值函数，UDTF用于解决一进多出业务场景，即其输入与输出是一对多的关系，读入一行数据，输出多个值。约束限制

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDAF 操作场景 DLI支持用户使用Hive UDAF（User Defined Aggregation Function，用户定义聚合函数）可对多行数据产生作用，通常与groupBy联合使用；等同于SQL中常用的SUM()，AVG()，也是聚合函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

Canal Format 功能描述 Canal是一个 CDC（ChangeLog Data Capture，变更日志数据捕获）工具，可以实时地将 MySQL 变更传输到其他系统。Canal 为变更日志提供了统一的数据格式，并支持使用 JSON 或 protobuf序列化消息（Canal

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 DLI整理了Spark2.4.x与Spark3.3.x版本在通用队列的差异，便于您了解Spark版本升级后通用队列上运行的作业在适配新版本引擎时的影响。 log4j依赖从1.x版本修改为2.x版本说明： log4j依赖从1

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通背景信息 DLI与内网数据源的网络联通通常指的是华为云内部服务的场景，例如DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。使用DLI提供的增强型跨源连接，采用对等连接的方式打通DLI与目的数据源的VPC网络，实现数据互通。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

数据库认证密码，需要和'username'一起配置。 connection.max-retry-timeout 否 60s Duration 尝试连接数据库服务器最大重试超时时间，不应小于1s。 scan.partition.column 否无 String 用于对输入进行分区的列名。分区扫描参数，具体请参考分区扫描功能介绍。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代

 帮助中心 > 数据湖探索 DLI > 用户指南
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据场景描述 DLI可以查询存储在OBS中的数据，本节操作介绍使用DLI提交SQL作业查询OBS数据的操作步骤。本例新建“sampledata.csv”文件上传OBS桶，并新建弹性资源池队列，使用DLI创建数据库和表，使用DLI提供的SQL编辑器查询表的1000条数据。

帮助中心 > 数据湖探索 DLI > 快速入门
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

使用Spark作业访问DLI元数据操作场景 DLI支持用户编写代码创建Spark作业来创建数据库、创建DLI表或OBS表和插入表数据等操作。本示例完整的演示通过编写java代码、使用Spark作业创建数据库、创建表和插入表数据的详细操作，帮助您在DLI上进行作业开发。该功能公

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
DLI弹性资源池与队列简介 - 数据湖探索 DLI

DLI弹性资源池与队列简介 DLI的计算资源是执行作业的基础，本节内容介绍DLI计算资源的模式和队列类型。什么是弹性资源池和队列？在了解DLI计算资源模式前首先了解弹性资源池和队列的基本概念。弹性资源池是DLI计算资源的一种池化管理模式，可以看做DLI计算资源的集合。DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
配置DLI云服务委托权限 - 数据湖探索 DLI

配置DLI云服务委托权限使用DLI服务前请先配置DLI云服务权限。本节操作适用于以下场景：首次使用DLI服务，请参考本节操作按需配置DLI云服务委托权限。使用DLI的过程中需要与其他云服务协同工作，因此需要您将部分服务的操作权限委托给DLI服务，确保DLI具备基本使用的权

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 AOM服务提供的Prometheus监控是一种全面对接开源Prometheus生态的监控解决方案。它支持多种类型的组件监控，提供预置监控大盘和全面托管的Prometheus服务，通过Prometheus监控来统一采集、存储和显示监控

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

约束与限制弹性资源池约束限制更多弹性资源池约束限制请参考弹性资源池使用约束限制。表1 弹性资源池约束限制限制项说明资源规格当前弹性资源池最大的计算资源 32000CUs。弹性资源池中可创建队列的最小CU：通用队列：4CUs SQL队列：Spark SQL队列：8CUs；HetuEngine

帮助中心 > 数据湖探索 DLI > 产品介绍
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据操作场景 DLI可以查询存储在RDS数据库中的数据，本节操作介绍使用DLI提交SQL作业查询RDS MySQL数据的操作步骤。本例创建RDS实例并新建数据库和表，创建DLI弹性资源池队列，通过增强型跨源连接打通DLI弹性资源池

 帮助中心 > 数据湖探索 DLI > 快速入门
DLI对接LakeFormation - 数据湖探索 DLI

DLI对接LakeFormation 操作场景 LakeFormation是企业级一站式湖仓构建服务，提供元数据统一管理能力，支持无缝对接多种计算引擎及大数据云服务，便捷高效地构建数据湖和运营相关业务，加速释放业务数据价值。在DLI的Spark作业和SQL作业场景，支持对接La

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据

总条数： 200

上一页
1
...
6
7
8
9
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDF - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线