搜索_华为云

Spark SQL常用配置项说明 - 数据湖探索 DLI

Spark SQL常用配置项说明本章节为您介绍DLI 批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
配置DLI访问其他云服务的委托权限 - 数据湖探索 DLI

配置DLI访问其他云服务的委托权限 DLI委托概述创建DLI自定义委托权限常见场景的委托权限策略典型场景DLI委托权限配置示例

 帮助中心 > 数据湖探索 DLI > 用户指南
配置DLI云服务委托权限 - 数据湖探索 DLI

配置DLI云服务委托权限使用DLI服务前请先配置DLI云服务权限。本节操作适用于以下场景：首次使用DLI服务，请参考本节操作按需配置DLI云服务委托权限。使用DLI的过程中需要与其他云服务协同工作，因此需要您将部分服务的操作权限委托给DLI服务，确保DLI具备基本使用的权

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。关于Python开发环境的配置请参考Python SDK环境配置。 DLI Python SDK依赖第三方库包括：urllib3

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
DLI作业开发流程 - 数据湖探索 DLI

据库和表。创建必要的存储桶来存储作业运行过程中产生的临时数据：作业日志、作业结果等。请参考配置DLI作业桶。配置元数据的访问权限。请参考在DLI控制台配置数据库权限、在DLI控制台配置表权限。 DLI数据导入指引 DLI支持在不迁移数据的情况下，直接对OBS中存储的数据进行查

 帮助中心 > 数据湖探索 DLI > 用户指南
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

设置和传入任意的Kafka原生配置文件。注意：后缀名必须匹配在Apache Kafka中的配置键。例如关闭自动创建topic：'properties.allow.auto.create.topics' = 'false'。存在一些配置不支持配置，如'key.deserializer'和'value

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

自定义镜像 DLI支持容器部署的集群。在容器集群中，Spark作业和Flink作业相关组件都运行在容器中，通过下载DLI提供的自定义镜像，可以改变Spark作业和Flink作业的容器运行环境。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式方便地帮助用户进行功能扩展。

帮助中心 > 数据湖探索 DLI > 功能总览
创建DLI表关联Oracle - 数据湖探索 DLI

已有的表。前提条件创建DLI表关联Oracle之前需要创建增强型跨源连接。管理控制台操作请参考增强型跨源连接。由于仅支持增强型跨源方式连接Oracle，且仅按需专属队列和包周期队列支持增强型跨源。因此仅按需专属队列和包周期队列支持在SQL作业中连接Oracle数据库。语法格式

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接Oracle表
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

及其以上版本。关于Java开发环境的配置请参考Java SDK环境配置。关于Java SDK的获取与安装请参考SDK的获取与安装。使用SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，具体操作请参考初始化DLI客户端

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

当DLI需要访问外部数据源，而这些数据源位于不同的VPC中时，由于网络隔离，DLI默认无法直接读取这些数据源的数据。通过创建增强型跨源连接，可以采用对等连接的方式打通DLI与数据源的VPC网络，从而实现数据的互通和跨源分析。增强型跨源连接的优势：网络连通性：直接打通DLI与目的数据源的VPC网络实现数据互通。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Flink作业模板相关 - 数据湖探索 DLI

Flink作业模板相关前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。新建作业模板 DLI提供新建Flink作业模板的接口。您可以使用该接口新建一个Flink作业模板。示例代码如下： 1 2 3 4

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

connector.key-column 否 table存储模式下可配置，将该字段值作为redis中的ext-key，未配置时，ext-key为生成的uuid connector.write-schema 否 table存储模式下可配置，是否将当前schema写入到redis，默认为false

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
区域和可用区 - 数据湖探索 DLI

地理位置一般情况下，建议就近选择靠近您或者您的目标用户的区域，这样可以减少网络时延，提高访问速度。不过，在基础设施、BGP网络品质、资源的操作与配置等方面，中国大陆各个区域间区别不大，如果您或者您的目标用户在中国大陆，可以不用考虑不同区域造成的网络时延问题。香港、曼谷等其他地区和国家

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

设置和传入任意的Kafka原生配置文件。注意： “properties.”中的后缀名必须是Apache Kafka中的配置键。例如关闭自动创建topic：'properties.allow.auto.create.topics' = 'false'。存在一些配置不支持配置，如'key.deserializer'和'value

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

作用范围：选择“项目级服务”。策略配置方式：选择“可视化视图”。策略内容：依次选择“允许”，“数据湖探索”，“dli:jobs:list_all”。单击“确认”，创建策略。图3 创建策略在“用户组”页面，找到需要授权的用户所属的用户组，单击用户组名称，进入用户组“权限管理”页面，单击“配置权限”。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
分配队列至项目 - 数据湖探索 DLI

分配队列至项目企业项目是一种云资源管理方式，企业可以根据组织架构规划企业项目，将分布在不同区域的资源按照企业项目进行统一管理，同时可以为每个企业项目设置拥有不同权限的用户组和用户。 DLI支持在创建队列时选择企业项目，本节操作为您介绍DLI队列资源如何绑定、修改企业项目。当前

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

操作、消息通知、用户授权操作所需的权限。配置DLI云服务委托权限。使用Flink 1.15和Spark 3.3.1（Spark通用队列场景）及以上版本的引擎执行作业时，需完成以下配置操作：需用户自行在IAM页面创建相关委托，并在作业配置中添加新建的委托信息。具体操作请参考创建DLI自定义委托权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
配置DLI程序包权限 - 数据湖探索 DLI

配置DLI程序包权限针对不同用户，可以通过权限设置分配不同的程序包组或程序包，不同用户之间的作业效率互不影响，保障作业性能。管理员用户、程序包组拥有程序包组的所有权限。不需要进行权限设置，且其他用户无法修改其程序包组权限。管理员用户、程序包的所有者拥有程序包的所有权限。不需

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

enabled 否 true Boolean Flink默认采用的是内存索引（使用Bueckt索引时不配置该项），需要将数据的主键缓存到内存中，保证目标表的数据唯一，因此需要配置该值，否则会导致数据重复，默认值：true。 write.index_bootstrap.tasks 否

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

业”。首先配置队列，Spark版本选择 3.3.1 及之后的版本。可以选择配置作业名称，便于识别和筛选。配置”应用程序”，路径指向上一步上传至OBS的Spark jar包。配置委托。选择提交DLI作业所需的委托。自定义委托请参考创建DLI自定义委托。配置”主类（--c

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业

总条数： 691

上一页
1
...
7
8
9
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL常用配置项说明 - 数据湖探索 DLI

配置DLI访问其他云服务的委托权限 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

创建DLI表关联Oracle - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

Flink作业模板相关 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

分配队列至项目 - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线