搜索_华为云

Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

true：开启 false：关闭建议关闭在线压缩，提升性能。但是调度compaction.schedule.enabled仍然建议开启，之后可通过离线异步压缩，执行阶段性生成的压缩plan。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

默认性能规格实例的CPU和内存。不同性能规格对应不同连接数和最大IOPS。 2vCPUs | 4GB 存储空间如果存储类型为SSD云盘或极速型SSD，可设置存储空间自动扩容，当存储空间可用率过小时，会自动扩容存储空间。 40GB 磁盘加密选择是否开启磁盘加密功能。

帮助中心 > 数据湖探索 DLI > 快速入门
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

OBS表压缩率较高更多跨源连接相关问题 Flink作业如何进行性能调优？更多 Spark作业相关问题如何查看DLI Spark作业的实际资源使用情况 Spark队列操作OBS表如何设置AK/SK？更多 Flink作业相关问题怎样将OBS表映射为DLI的分区表？

帮助中心 > 数据湖探索 DLI > 成长地图
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

表1 实时查询和读优化查询的trade-off Trade-off 实时查询读优化查询 Data Latency（数据时延）低高 Query Latency（查询时延）只对于MOR表，高（合并parquet + delta log) 低（读取parquet文件性能） COW

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

如果这个比例大于配置的阈值，则认为预聚合效果不好，此时Spark可以选择跳过部分聚合，避免进一步的性能损失。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
DWS结果表（不推荐使用） - 数据湖探索 DLI

它能提升写入数据的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。 sink.buffer-flush.interval 否 1s Duration 刷新缓存的间隔，在这段时间内以异步线程刷新数据。它能提升写入数据库的性能，但是也可能增加延迟。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

它能提升写入数据的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。 sink.buffer-flush.interval 否 1s Duration 刷新缓存的间隔，在这段时间内以异步线程刷新数据。它能提升写入数据库的性能，但是也可能增加延迟。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

否则，作业容易出现性能问题，避免表更新和重新加载过于频繁。缓存刷新需加载整个Hive表。无法区分新数据和旧数据。参数说明在执行与最新的Hive表的时间关联时，Hive表将被缓存到Slot内存中，然后通过键将流中的每条记录与表进行关联，以确定是否找到匹配项。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
了解数据目录、数据库和表 - 数据湖探索 DLI

DLI表的数据存储在DLI服务内部，查询性能更好，适用于对时延敏感类的业务，如交互类的查询等。库表管理中表的列表页面，表类型为Managed的即代表DLI表。 OBS表 OBS表的数据存储在OBS上，适用于对时延不敏感的业务，如历史数据统计分析等。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

区域从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
DLI作业开发流程 - 数据湖探索 DLI

您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。

帮助中心 > 数据湖探索 DLI > 用户指南
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

bulk_insert：该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高的，但是无法控制小文件，而upsert和insert操作可以很好的控制小文件。 upsert：默认操作类型。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
使用CDM迁移数据至DLI - 数据湖探索 DLI

抽取并发数：设置同时执行的抽取任务数，适当的抽取并发数可以提升迁移效率，配置原则请参见性能调优。这里保持默认值“1”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

许多分区可能会导致性能下降。对未分区表进行流式读取时，要求将每个文件以原子方式写入目标目录。分区表的流式读取要求在 hive 元存储的视图中以原子方式添加每个分区。否则，将使用添加到现有分区的新数据。流式读取不支持 Flink DDL 中的水印语法。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

Spark程序包管理针对不同角色用户，您可以通过权限设置分配不同的程序包组或程序包，不同用户之间的作业效率互不影响，保障作业性能。开发指南 Spark SQL语法参考提供Spark SQL相关的数据库、表、分区、导入及导出数据、自定义函数、内置函数等语法说明和样例指导。

帮助中心 > 数据湖探索 DLI > 快速入门
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

HDFS文件方式读取数据时，性能较好，但不支持使用WHERE条件做数据过滤及在字段映射页面添加新字段。 JDBC方式读取数据时，支持使用WHERE条件做数据过滤及在字段映射页面添加新字段。更多参数的详细配置可以参考：CDM配置Hive源端参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
DLI自定义策略 - 数据湖探索 DLI

服务名为产品名称，例如dli、evs和vpc等，服务名仅支持小写。资源类型和操作没有大小写，要求支持通配符号*，无需罗列全部授权项。资源类型可以参考表4中的资源类型。操作：操作以IAM服务中已经注册的action为准。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

Lookup cache的主要目的是用于提高时态表关联JDBC连接器的性能。当Lookup cache被启用时，每个进程（即TaskManager）将维护一个缓存。Flink将优先查找缓存，只有当缓存未查找到时才向外部数据库发送请求，并使用返回的数据更新缓存。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表

总条数： 102

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi 结果表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线