搜索_华为云

Hudi Compaction操作说明 - 数据湖探索 DLI

Spark/Flink流任务仅执行Schedule，然后另起一个Spark SQL任务定时仅执行Run。 Spark批任务可以直接同时执行Schedule + Run。为了保证入湖的最高效率，推荐使用同步产生compaction调度计划，异步执行compaction调度计划。父主题：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

用户Flink程序的依赖包与DLI Flink平台的内置依赖包冲突，导致提交失败。解决方案首先您需要排除是否有冲突的Jar包。含DLI Flink提供了一系列预装在DLI服务中的依赖包，用于支持各种数据处理和分析任务。如果您上传的Jar包中包含DLI Flink运行平台中已经存在的包，则会提示Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
故障恢复 - 数据湖探索 DLI
故障恢复 - 数据湖探索 DLI

故障恢复系统级故障恢复 DLI系统采用存算分离的架构，计算集群基于K8s资源调度和故障切换机制，在系统故障时，支持自动故障恢复。作业级故障恢复 Flink、Spark作业支持配置自动重启恢复机制，在开启自动重启功能后，当作业出现异常时将自动重启恢复作业。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
EXPLAIN - 数据湖探索 DLI
EXPLAIN - 数据湖探索 DLI

JSON } TYPE { LOGICAL | DISTRIBUTED | VALIDATE | IO } 描述显示一条语句的逻辑的或者分布式的执行计划，也可以用于校验一条SQL语句，或者是分析IO。参数TYPE DISTRIBUTED用于显示分片后的计划（fragmented

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
离线Compaction配置 - 数据湖探索 DLI

elog对资源要求较小，为避免资源浪费，使用DataArts调度的话可以compaction作为一个任务，clean、archive作为一个任务分别配置不同的资源执行来节省资源使用。执行资源 Compaction调度的间隔应小于Compaction计划生成的间隔，例如1小时左右

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Flink作业性能调优 - 数据湖探索 DLI

组当前待消费的数据总量。如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择“云服务监控 > 分布式消息服务 > kafka专享版” ，单击“kafka实例名称 > 消费组” ，选择具体的消费组名称，查看消费组的指标信息。图1 消费组反压状态

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

属性编辑完成后，单击“保存”，保存属性配置信息。配置作业调度由于创建库表只需要执行一次，所以本示例只设置为单次调度。鼠标左键单击作业画布空白处。单击 “调度配置” ，选择 “单次调度”（该作业只会被调度一次，后续不会再被自动调度）。图9 配置作业调度完成调度配置后单击“执行调度”。单击“前往运维中心”可以查看作业运行状况。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

Upsert Kafka 功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。Upsert Kafka 连接器支持以upsert方式从Kafka topic中读取数据并将数据写入Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DLI弹性资源池与队列简介 - 数据湖探索 DLI

的数据量计费。由于default队列是共享资源，在使用时可能会出现资源抢占的情况，不能保证每次都能获得资源来执行作业。 default队列适用小规模或临时的数据处理需求。对于重要的或需要保证资源的作业，建议购买弹性资源池并在弹性资源池中创建队列来执行作业。 SQL队列： SQL

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。云搜索服务（Cloud Search Service，简称CSS）为DLI提供托管的分布式搜索引擎服务，完全兼

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
ROLL_BACK - 数据湖探索 DLI
ROLL_BACK - 数据湖探索 DLI

只能依次回滚最新的commit时间戳，可以通过SHOW_TIME_LINE命令检查最新的instant time。系统响应可以检查任务状态是否成功，查看任务结果，查看任务日志确认有无异常。父主题： Hudi CALL COMMAND语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
FileSystem结果表 - 数据湖探索 DLI

FileSystem结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
对象存储OBS结果表 - 数据湖探索 DLI

对象存储OBS结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

表格存储服务CloudTable相关介绍请参考《表格存储服务产品介绍》。云搜索服务CSS相关介绍请参考《云搜索服务产品介绍》。分布式缓存服务DCS相关介绍请参考《分布式缓存服务产品介绍》。文档数据库服务DDS相关介绍请参考《文档数据库服务产品介绍》。数据仓库服务GaussDB（DWS

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
迁移数据场景概述 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI DWS CDM 典型场景示例：迁移DWS数据至DLI 数据迁移数据类型映射将其他云服务或业务平台数据迁移到DLI ，或者将DLI数据迁移到其他云服务或业务平台时，涉及到源和目的端数据类型的转换和映射，根据表2可以获取到源和目的端的数据类型映射关系。表2 数据类型映射表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Elasticsearch结果表 - 数据湖探索 DLI

级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。云搜索服务（Cloud Search Service，简称CSS）为DLI提供托管的分布式搜索引擎服务，完全兼

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
FileSytem结果表 - 数据湖探索 DLI

FileSytem结果表功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

错误，通常是由于作业的资源配置不足、数据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。例如访问DWS大批量数据库数据时设置并发数，启动多任务的方式运行，避免作业运行超时。具体并发设置可以参考对接

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类

总条数： 218

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Compaction操作说明 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

故障恢复 - 数据湖探索 DLI

EXPLAIN - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

ROLL_BACK - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线