搜索_华为云

创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Spark作业场景描述本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
Hudi表索引设计规范 - 数据湖探索 DLI

引。实时入湖场景中，Spark引擎采用Bucket索引，Flink引擎可以用Bucket索引或者状态索引。实时入湖都是需要分钟内或者分钟级的高性能入湖，索引的选择会影响到写Hudi表的性能。在性能方面各个索引的区别如下： Bucket索引优点：写入过程中对主键进行hash分

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

对于无内部状态的作业，您可以配置kafka数据源的启动时间或者消费位点到作业停止之前。对于有内部状态的作业，您可以在停止作业时，勾选“触发保存点”。成功后，再次启动作业时，开启“恢复保存点”，作业将从选择的savepoint文件中恢复消费位点及状态。同时，由于Flink Ch

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
分组 - 数据湖探索 DLI
分组 - 数据湖探索 DLI

分组按列GROUP BY 按表达式GROUP BY GROUP BY中使用HAVING ROLLUP GROUPING SETS 父主题： SELECT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT
separator - 数据湖探索 DLI
separator - 数据湖探索 DLI

separator 格式无。说明分隔符，仅支持CHAR类型，支持用户自定义，如逗号、分号、冒号等。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

单击右上角的“创建作业”，在Spark作业编辑窗口，可以选择使用“表单模式”或者“API模式”进行参数设置。以下以“表单模式”页面进行说明，“API模式”即采用API接口模式设置参数及参数值，具体请参考《数据湖探索API参考》。选择运行队列。在下拉列表中选择要使用的队列。选择Spar

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。 DLI 在创

 帮助中心 > 数据湖探索 DLI > 最佳实践
配置SQL防御规则 - 数据湖探索 DLI

的性能或者平台稳定性。 DLI在Spark SQL引擎中增加SQL防御能力，基于用户可理解的SQL防御策略，实现对典型大SQL、低质量SQL的主动防御，包括事前提示、拦截和事中熔断，并不强制改变用户的SQL提交方式、SQL语法，对业务零改动且易落地。 DLI支持可视化配置SQL防

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

模式下从Hive写入数据。当作为BATCH应用程序运行时，Flink将写 Hive表，仅在作业完成时使这些记录可见。BATCH 写入支持追加和覆盖现有表。 STREAMING 不断写入，向Hive添加新数据，以增量方式提交记录使其可见。用户控制何时/如何触发具有多个属性的提交。流式写入不支

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
什么是DLI分区表的列赋权？ - 数据湖探索 DLI

什么是DLI分区表的列赋权？用户无法对分区表的分区列进行权限操作。当用户对分区表的任意一列非分区列有权限，则默认对分区列有权限。当查看用户在分区表上的权限的时候，不会显示对分区列有权限。父主题： DLI权限管理类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

您可以使用本文档提供API对数据湖探索进行相关操作，包括队列、SQL作业、Flink作业、Spark作业和跨源连接等等。支持的全部操作请参见API概览。在调用数据湖探索API之前，请确保已经充分了解数据湖探索相关概念。详细信息请参见产品介绍。父主题： API使用前必读

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

to refresh. 问题根因 API以同步模式调用运行时会有两分钟的超时时间限制，如果API调用超过该时间限制则会超时报错。解决方案调用“提交SQL作业”API时可以通过设置“dli.sql.sqlasync.enabled”参数为“true”来异步运行该作业。具体可以参考提交SQL作业API。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

从而来保障作业的稳定运行。注意事项建议对流批业务实施资源池的精细化管理，将Flink实时流类型的作业与SQL批处理类型的作业分别置于独立的弹性资源池中。优势在于：Flink实时流任务具有常驻运行的特质，确保其稳定运行而不会强制缩容，进而避免任务中断和系统不稳定。而SQL

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SELECT 基本语句排序分组连接子句别名SELECT 集合运算SELECT WITH...AS CASE...WHEN

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Spark作业开发类 - 数据湖探索 DLI

Spark作业开发类 Spark作业使用咨询 Spark如何将数据写入到DLI表中通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

'topic' = 'TOPIC', 'properties.bootstrap.servers' = 'KafkaIP:PROT,KafkaIP:PROT,KafkaIP:PROT', 'properties.group.id' = 'GroupId', 'scan.startup

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
描述表信息（废弃） - 数据湖探索 DLI

描述表信息（废弃）功能介绍该API用于描述指定表的元数据信息。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v1.0/{project_id}/databases/{database_name}/tables/{table_name}

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

default队列 DLI服务预置了名为“default”的队列，资源的大小是按需分配的。用户在不确定所需队列容量或没有可创建队列空间的情况下，可以使用该队列执行作业。“default”队列只用于用户体验，所有人共用，用户间可能会出现抢占资源的情况，不能保证每次都可以得到资源执行相关操作。发布区域：全部

 帮助中心 > 数据湖探索 DLI > 功能总览
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

强型跨源连接，且用户可以根据实际所需设置相应安全组规则。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

Redis源表功能描述创建source流从Redis获取数据，作为作业的输入数据。前提条件创建该作业前，需要建立DLI和Redis的增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis

总条数： 982

上一页
1
2
3
4
5
...
50
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建并提交Spark作业 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

分组 - 数据湖探索 DLI

separator - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

什么是DLI分区表的列赋权？ - 数据湖探索 DLI

概述 - 数据湖探索 DLI

创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

描述表信息（废弃） - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线