搜索_华为云

Hudi Compaction操作说明 - 数据湖探索 DLI

action生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进行不阻塞摄入的异步Compaction很有意义。如何执行Compaction 仅执行Schedule Spark SQL（设置如下参数，写数据时触发） hoodie.compact.inline=true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
FileSytem结果表 - 数据湖探索 DLI

FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。语法格式 1 2 3 4 5 6 7

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。本例介绍通过DLI控制台

 帮助中心 > 数据湖探索 DLI > 快速入门
Hudi表索引设计规范 - 数据湖探索 DLI

可能会有什么影响？读写任务可能会出现OOM的问题，解决方法就是提升单个task的内存占比。读写性能下降，因为单个task的处理的数据量变大，导致处理耗时变大。父主题： Hudi数据表设计规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
管理DLI全局变量 - 数据湖探索 DLI

在编辑作业过程中重复定义，减少开发与维护成本。通过使用全局变量可以替换长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。创建全局变量在DLI控制台左侧导航栏中单击“全局配置 > 全局变量”。在“全局变量”页面，单击右上角“创建变量”，可创建新的全局变量。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
增强型跨源连接概述 - 数据湖探索 DLI

增强型跨源连接概述为什么要创建增强型跨源连接？ DLI跨源分析场景连接外部数据源时，由于数据源的VPC与DLI VPC不同，网络无法连通，导致DLI无法读取数据源数据。DLI提供的增强型跨源连接功能可以实现DLI与数据源的网络连通。本节操作为您介绍跨VPC的数据源网络连通方案：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
DLI SDK与API的对应关系 - 数据湖探索 DLI

ch_id} 查询所有批处理作业 listAllBatchJobs - GET /v2.0/{project_id}/batches 查询批处理作业详情 - - GET /v2.0/{project_id}/batches/{batch_id} 查询批处理作业状态 getStateBatchJob

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
DLI资源配额类 - 数据湖探索 DLI

DLI资源配额类什么是用户配额？怎样查看我的配额如何申请扩大配额

 帮助中心 > 数据湖探索 DLI > 常见问题
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

x。该场景作业需要DLI与MySQL建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接配置跨源

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
自定义函数类型推导 - 数据湖探索 DLI

值数据类型。从逻辑角度看，Planner需要知道数据类型、精度和小数位数；从 JVM 角度来看，Planner 在调用自定义函数时需要知道如何将内部数据结构表示为JVM对象。 Flink 自定义函数实现了自动的类型推导提取，通过反射从函数的类及其求值方法中派生数据类型。然而以反射

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
对接HBase - 数据湖探索 DLI
对接HBase - 数据湖探索 DLI

对接HBase MRS配置 scala样例代码 pyspark样例代码 java样例代码故障处理父主题：使用Spark作业跨源访问数据源

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
对接Redis - 数据湖探索 DLI
对接Redis - 数据湖探索 DLI

对接Redis scala样例代码 pyspark样例代码 java样例代码故障处理父主题：使用Spark作业跨源访问数据源

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
对接OpenTSDB - 数据湖探索 DLI
对接OpenTSDB - 数据湖探索 DLI

对接OpenTSDB scala样例代码 pyspark样例代码 java样例代码故障处理父主题：使用Spark作业跨源访问数据源

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
怎样管理在DLI上运行的作业 - 数据湖探索 DLI

怎样管理在DLI上运行的作业管理大量的DLI作业时您可以采用以下方案：作业分组：将几万个作业根据不同的类型分组，不同类型的作业通过不同的队列运行。创建IAM子用户或者创建IAM子用户，将不同类型的作业通过不同的用户执行。具体请参考《数据湖探索用户指南》。此外DLI还

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
自定义函数类型推导 - 数据湖探索 DLI

值数据类型。从逻辑角度看，Planner需要知道数据类型、精度和小数位数；从 JVM 角度来看，Planner 在调用自定义函数时需要知道如何将内部数据结构表示为JVM对象。 Flink 自定义函数实现了自动的类型推导提取，通过反射从函数的类及其求值方法中派生数据类型。然而以反射

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务弹性扩缩容定时任务使用场景通常，用户业务繁忙的场景是有周期性的，在某个周期内，用户需要更多的计算资源来处理业务，过了这个周期，则不需要那么多资源。如果用户购买的队列规格比较小，在业务繁忙时会存在资源不足的情况；而如果购买的队列规格比较大，又可能会存在资源浪费的情况。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
使用DLI分析电商BI报表 - 数据湖探索 DLI

使用DLI分析电商BI报表应用场景某电商商城在保持高速发展的同时，沉淀了数亿的忠实用户，积累了海量的真实数据。如何利用BI工具从历史数据中找出商机，是大数据应用在精准营销中的关键问题，也是所有电商平台在做智能化升级时所需要的核心技术。本案例以某商城真实的用户、商品、评论数据

 帮助中心 > 数据湖探索 DLI > 最佳实践
使用DLI分析账单消费数据 - 数据湖探索 DLI

使用DLI分析账单消费数据应用场景本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：

帮助中心 > 数据湖探索 DLI > 最佳实践
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。操作流程图1 配置DLI队列访问公网流程步骤1：创建VPC 登录

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

建议对流批业务实施资源池的精细化管理，将Flink实时流类型的作业与SQL批处理类型的作业分别置于独立的弹性资源池中。优势在于：Flink实时流任务具有常驻运行的特质，确保其稳定运行而不会强制缩容，进而避免任务中断和系统不稳定。而SQL批处理类型的作业在独立的资源池中能够更加灵活地进行扩缩容，显著提升扩缩容的成功率和操作效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池

总条数： 465

上一页
1
...
12
13
14
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Compaction操作说明 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

DLI资源配额类 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

对接HBase - 数据湖探索 DLI

对接Redis - 数据湖探索 DLI

对接OpenTSDB - 数据湖探索 DLI

怎样管理在DLI上运行的作业 - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线