搜索_华为云

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的剩余可用

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Spark SQL常用配置项说明 - 数据湖探索 DLI

Spark SQL常用配置项说明本章节为您介绍DLI 批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Spark3.3.x： SHOW TABLE EXTENDED的输出schema从database: string变成了namespace: string。其中对于内置catalog，namespace字段被命名为database；对于v2 catalog没有变化。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

Doris源表功能描述 Flink SQL作业读取Doris源表。前提条件该场景作业需要运行在DLI的独享队列上，因此要与Doris建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
SQL作业运行慢如何定位 - 数据湖探索 DLI

SQL作业运行慢如何定位作业运行慢可以通过以下步骤进行排查处理。可能原因1：FullGC原因导致作业运行慢判断当前作业运行慢是否是FullGC导致：登录DLI控制台，单击“作业管理 > SQL作业”。在SQL作业页面，在对应作业的“操作”列，单击“更多 > 归档日志”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
SQL作业开发类 - 数据湖探索 DLI

SQL作业开发类 SQL作业使用咨询如何合并小文件 DLI如何访问OBS桶中的数据创建OBS表时怎样指定OBS路径关联OBS桶中嵌套的JSON格式数据如何创建表 count函数如何进行聚合怎样将一个区域中的DLI表数据同步到另一个区域中？ SQL作业如何指定表的部分字段进行表数据的插入

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
监控安全风险 - 数据湖探索 DLI

监控安全风险云监控服务为用户的云上资源提供了立体化监控平台。通过云监控您可以全面了解云上的资源使用情况、业务的运行状况，并及时收到异常告警做出反应，保证业务顺畅运行。 DLI服务提供基于云监控服务CES的资源监控能力 DLI已对接云监控服务，提供基于云监控服务的资源监控能力，帮助用户监控账号下的

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据操作场景 DLI可以查询存储在RDS数据库中的数据，本节操作介绍使用DLI提交SQL作业查询RDS MySQL数据的操作步骤。本例创建RDS实例并新建数据库和表，创建DLI弹性资源池队列，通过增强型跨源连接打通DLI弹性资源池和

 帮助中心 > 数据湖探索 DLI > 快速入门
开启Flink作业动态扩缩容 - 数据湖探索 DLI

当弹性资源池中剩余的Pod资源足以支持作业的最小资源需求时，系统将自动减少作业所在节点的数量，确保作业高效运行，同时提高资源的利用效率。当前仅Flink 1.12版本的作业支持开启动态扩缩容。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查看Flink作业详情 - 数据湖探索 DLI

查看Flink作业详情创建作业后，您可以在DLI管理控制台查看Flink作业的基本信息、作业详情、任务列表、执行计划等信息。本节操作介绍怎样查看Flink作业相关信息。表1 查看Flink作业相关信息类型说明操作指导 Flink作业基本信息包括Flink作业的ID、作业类型

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
队列相关API（推荐） - 数据湖探索 DLI

队列相关API（推荐）创建队列删除队列查询所有队列查询队列详情重启/扩容/缩容队列创建指定地址连通性测试请求查询指定地址连通性测试详情

 帮助中心 > 数据湖探索 DLI > API参考
从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述该场景为对汽车驾驶的实时数据信息进行分析，将满足特定条件的数据结果进行汇总。汽车驾驶的实时数据信息为数据源发送到Kafka中，再将Kafka数据的分析结果输出到DWS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Flink作业性能调优 - 数据湖探索 DLI

Flink作业性能调优性能调优相关基本概念消费组积压消费组积压可通过topic最新数据offset减去该消费组已提交最大offset计算得出，说明的是该消费组当前待消费的数据总量。如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择“

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通背景信息 DLI与内网数据源的网络联通通常指的是华为云内部服务的场景，例如DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。使用DLI提供的增强型跨源连接，采用对等连接的方式打通DLI与目的数据源的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？问题现象客户创建增强型跨源连接DLI和DWS，安全组已配置出方向规则到关联队列，使用的是密码形式的跨源认证，报DLI.0999: PSQLException: The connection attempt failed。原因分析出现该问题可能原因如下

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接操作场景使用DLI访问其他数据源的数据前，首先要通过建立增强型跨源连接打通DLI和数据源之间的网络，DLI才能够访问、导入、查询、分析其他数据源的数据。例如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和对应数据源VPC之间的网络，

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）

总条数： 389

上一页
1
...
13
14
15
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

Doris源表 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

SQL作业开发类 - 数据湖探索 DLI

监控安全风险 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

队列相关API（推荐） - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线