搜索_华为云

配置DLI作业桶 - 数据湖探索 DLI

配置DLI作业桶使用DLI服务前需配置DLI作业桶，该桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台的“全局配置 > 工程配置”页面配置DLI作业桶。操作前准备配置前，请先购买OBS桶或并行文件系统。大数据场景推

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
Delta常见配置参数 - 数据湖探索 DLI

Delta常见配置参数提交DLI Spark SQL作业时，在“SQL编辑器”界面右上角的“设置 > 参数设置”中配置Delta参数。表1 Delta常见配置项参数描述默认值 spark.databricks.delta.retentionDurationCheck.enabled

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
配置Flink作业权限 - 数据湖探索 DLI

配置Flink作业权限 Flink作业权限操作场景针对不同用户，可以通过权限设置分配不同的作业，不同用户之间的作业效率互不影响，保障作业性能。管理员用户和作业的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其作业权限。给新用户设置作业权限时，该用户所在用户组的所属区域需具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
配置SQL防御规则 - 数据湖探索 DLI

描述信息输入规则描述信息。防御规则动作配置当前SQL防御规则动作的阈值参数。 SQL规则支持的类型：提示：配置系统对SQL请求满足防御规则后是否进行日志记录和提示处理。开启按钮时，如果当前规则有变量参数，需同时配置阈值。拦截：配置系统对SQL请求满足防御规则后是否进行拦截

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

云。子网：选择步骤1：获取外部数据源的内网IP、端口和安全组获取的外部数据源的子网。其他参数可以根据需要选择配置。参数配置完成后，单击“确定”完成增强型跨源配置。单击创建的跨源连接名称，查看跨源连接的连接状态，等待连接状态为：“已激活”后可以进行后续步骤。如果是连接MRS

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
配置DLI与数据源网络连通（增强型跨源连接） - 数据湖探索 DLI

配置DLI与数据源网络连通（增强型跨源连接）增强型跨源连接概述创建增强型跨源连接建立DLI与共享VPC中资源的网络连接 DLI常用跨源分析开发方式父主题：配置DLI读写外部数据源数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

头。如果开启安全模式，未开启https，需要配置用户名username、密码password，且语法中hosts字段值以http开头。如果开启安全模式，开启https，需要配置用户名username、密码password、证书位置certificate。请注意该场景hosts字段值以https开头。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Python SDK环境配置 - 数据湖探索 DLI

”，可能是由于缺少C++编译器导致的报错，建议您根据提示信息安装相应版本的Visual Studio编译器解决。部分操作系统Visual Studio安装后需重启才可以生效。安装DLI服务Python SDK。选择SDK获取与安装获取的安装包，解压安装包。将"dli-sdk-python-<version>

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Java SDK环境配置 - 数据湖探索 DLI

Java SDK环境配置 Java开发环境配置 SDK的获取与安装初始化DLI客户端父主题： Java SDK

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

个唯一的Server ID，确保MySQL服务器能够区分不同的客户端并维护各自的Binlog读取位置。如果不同的作业共享相同的Server ID，可能会导致从错误的Binlog位置读取数据，从而引发数据不一致的问题。可以通过SQL Hints为每个Source Reader分配唯一的Server

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

DLI Flink MRS Flink 特色能力产品模式全托管（无需人力运维集群）半托管（需要人力运维集群）弹性扩缩容支持集群容器化部署。用户可以根据业务负载进行弹性扩缩容，能够基于作业的负载动态调整作业使用资源大小。支持基于作业优先级动态调整作业的使用资源。仅支持YARN集群。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
SDK获取与安装 - 数据湖探索 DLI

SDK获取与安装 Python SDK安装方式本节操作介绍安装Python SDK的操作指导。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。 “dli-sdk-python-x.x.x.zip”压缩包，解压后目录结构如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Spark SQL常用配置项说明 - 数据湖探索 DLI

Spark SQL常用配置项说明本章节为您介绍DLI 批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
配置DLI访问其他云服务的委托权限 - 数据湖探索 DLI

配置DLI访问其他云服务的委托权限 DLI委托概述创建DLI自定义委托权限常见场景的委托权限策略典型场景DLI委托权限配置示例

 帮助中心 > 数据湖探索 DLI > 用户指南
配置DLI云服务委托权限 - 数据湖探索 DLI

配置DLI云服务委托权限使用DLI服务前请先配置DLI云服务权限。本节操作适用于以下场景：首次使用DLI服务，请参考本节操作按需配置DLI云服务委托权限。使用DLI的过程中需要与其他云服务协同工作，因此需要您将部分服务的操作权限委托给DLI服务，确保DLI具备基本使用的权

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
增强型跨源连接概述 - 数据湖探索 DLI

络。测试网络连通性：验证队列与数据源网络连通性。目前DLI支持跨源访问的数据源请参考DLI常用跨源分析开发方式。在跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，Spark 3.3.1及以上版本、Flink 1.15及以上版本的跨源访问场景推荐使用数据加密服务DEW来

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
创建增强型跨源连接 - 数据湖探索 DLI

目的数据源子网与队列所在子网为不同的子网，否则会造成网段冲突。主机信息可选参数，用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。例如：访问MRS的HBase集群时需要配置Zookeeper实例的主机名（即域名）与对应的IP地址。每行填写一条记录，填写格式为：“IP

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Hudi表索引设计规范 - 数据湖探索 DLI

Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写入；该索引写入速度最快，但是需要合理配置分桶数目；Flink、Spark均支持该索引写入。状态索引：Flink引擎独有索引，是将行记录的存储位置记录到状态后端的一种索引形式，在作业冷启动过程中会遍历所有数据存储文件生成索引信息。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
创建批处理作业 - 数据湖探索 DLI

Object batch配置项，参考Spark Configuration。 name 否 String 创建时用户指定的批处理名称，不能超过128个字符。 driverMemory 否 String Spark应用的Driver内存，参数配置例如2G, 2048M。该配置项会替换“sc_

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
普通队列弹性扩缩容 - 数据湖探索 DLI

assigning, which is not available”，表示需要等待队列资源分配完毕才可进行扩缩容。队列资源扩容时，可能会由于物理资源不足导致队列资源无法扩容到设定的目标大小。队列资源缩容时，系统不保证将队列资源完全缩容到设定的目标大小。通常队列资源缩容时，系统会先

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列

总条数： 547

上一页
1
...
6
7
8
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置DLI作业桶 - 数据湖探索 DLI

Delta常见配置参数 - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

配置DLI与数据源网络连通（增强型跨源连接） - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

Java SDK环境配置 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

配置DLI访问其他云服务的委托权限 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线