搜索_华为云

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

”SQL作业”跳转到SQL作业记录中检查。在执行SQL的时候配置Hudi参数： DLI不支持直接使用SET语句配置参数点击”设置”，随后在”参数设置”一栏可以配置键和值，Hudi的参数可以通过此处提交。配置在此处的参数会在提交SQL作业时被应用。随后可以在左侧菜单点击”作业管理”->”SQL作业”，随后在列表中

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
导出DLI表数据至OBS中 - 数据湖探索 DLI

页面。在“数据管理”页面导出数据。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需导出数据的表对应的数据库，进入该数据的“表管理”页面。在对应表（DLI表）的“操作”栏中选择“更多”中的“导出”，弹出“导出数据”页面。在“SQL编辑器”页面导出数据。在管理控制台左侧，单击“SQL编辑器”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

rownum < 2 来识别查询能否被翻译成窗口去重。注意事项 Flink 只支持在滚动窗口、滑动窗口和累积窗口的窗口表值函数后进行窗口去重窗口去重只支持根据事件时间属性进行排序示例本示例展示了在10分钟的滚动窗口上保持最后一条记录。 -- tables must have time

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
SQL作业运行慢如何定位 - 数据湖探索 DLI

判断当前作业运行慢是否是FullGC导致：登录DLI控制台，单击“作业管理 > SQL作业”。在SQL作业页面，在对应作业的“操作”列，单击“更多 > 归档日志”。图1 归档日志在OBS目录下，获取归档日志文件夹，详细如下。 Spark SQL作业：查看带有“driver”

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
DLI作业开发流程 - 数据湖探索 DLI

创建必要的存储桶来存储作业运行过程中产生的临时数据：作业日志、作业结果等。请参考配置DLI作业桶。配置元数据的访问权限。请参考在DLI控制台配置数据库权限、在DLI控制台配置表权限。 DLI数据导入指引 DLI支持在不迁移数据的情况下，直接对OBS中存储的数据进行查询分析，您只需要将数据上传OBS即可使用DLI进行数据分析。

帮助中心 > 数据湖探索 DLI > 用户指南
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

队列是使用DLI服务的基础，执行SQL前需要先创建队列。具体可以参考《用户指南》中的“创建队列”章节。在DLI管理控制台，单击左侧导航栏中的“SQL编辑器”，可进入SQL作业“SQL编辑器”页面。在“SQL编辑器”页面右侧的编辑窗口中，输入如下创建数据库的SQL语句，单击“执行”。阅读并同意隐私协议，单击“确定”。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

费用，用户在弹性资源池添加的队列上运行作业时按照弹性资源池CU时计费。扫描数据量套餐包：按照用户每个作业的数据扫描量（单位为“GB”）收取计算费用。队列CU时套餐包：按照“CU时”收取计算费用，用户在自建队列上运行作业时按照队列CU时计费。存储量套餐包：按照存储在DLI服务

 帮助中心 > 数据湖探索 DLI > 计费说明
Upsert Kafka结果表 - 数据湖探索 DLI

的消息被删除）。Flink将根据主键列的值对数据进行分区，从而保证主键上的消息有序，因此同一主键上的更新/删除消息将落在同一分区中。前提条件确保已创建Kafka集群。该场景作业需要运行在DLI的独享队列上，因此要与Kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。如何升级到Flink 1.15版本？在DLI管理控制台，购买弹性资源池和队列资源，用于提供执行作业所需的计算资源。在DLI管理控制台，单击“作业管理 > Flink作业”。在作业管理页面，单击作业操作列的“编辑”，进入作业运行参数编辑页面。配

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
创建消息通知主题 - 数据湖探索 DLI

如果单个队列和所有队列的终端不一致，当选择了单个队列，同时选择了所有队列进行订阅时，在所有队列的消息通知中将不包含该队列的消息。创建消息通知主题后，只有在订阅队列上创建的Spark作业失败时才会收到消息通知。图2 创建主题成功单击图2中“主题管理”，跳转至消息通知服务“主题管理”页面。图3 主题管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

DLI服务时，如果触发了监控列表中的关键操作，那么CTS会在记录操作日志的同时，向相关订阅者实时发送通知。 DLI的作业日志在创建DLI作业时，可以在作业编辑页面，通过保存作业日志功能，将作业运行时的日志信息保存到OBS。查询作业日志信息，参考查看DLI SQL日志。作业日

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

跨源表：表类型同样为External。创建DLI表时不支持指定存储路径。数据导入仅支持将OBS上的数据导入DLI或OBS中。支持将OBS中CSV，Parquet，ORC，JSON和Avro格式的数据导入到在DLI中创建的表。将CSV格式数据导入分区表，需在数据源中将分区列放在最后一列。导入数据的编码格式仅支持UTF-8。

帮助中心 > 数据湖探索 DLI > 产品介绍
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

CLEAN 命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

的权限介绍和授权操作请参考《数据湖探索用户指南》。创建队列。在“资源管理 > 队列管理”下，单击右上角“购买队列”，进入购买队列页面选择“通用队列”，即Spark作业的计算资源。如果创建队列的用户不是管理员用户，在创建队列后，需要管理员用户赋权后才可使用。关于赋权的具体操作请参考《数据湖探索用户指南》。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

安全，建议您不要直接使用账号进行日常管理工作，而是创建用户并使用他们进行日常管理工作。用户由账号在IAM中创建的用户，是云服务的使用人员，具有身份凭证（密码和访问密钥）。在我的凭证下，您可以查看账号ID和用户ID。通常在调用API的鉴权过程中，您需要用到账号、用户和密码等信息。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
区域和可用区 - 数据湖探索 DLI

问速度。不过，在基础设施、BGP网络品质、资源的操作与配置等方面，中国大陆各个区域间区别不大，如果您或者您的目标用户在中国大陆，可以不用考虑不同区域造成的网络时延问题。香港、曼谷等其他地区和国家提供国际带宽，主要面向非中国大陆地区的用户。如果您或者您的目标用户在中国大陆，使用这些区域会有较长的访问时延，不建议使用。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Upsert Kafka源表 - 数据湖探索 DLI

SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 Upsert Kafka 始终以upsert方式工作，并且需要在DDL中定义主键。在具有相同主键值的消息按序存储在同一个分区的前提下，在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

作业日志保存方式，包含以下三种情况：提交失败，只会在submit-client下生成提交日志。运行失败且在1分钟内的日志，可以直接在管理控制台页面查看，具体如下：在“作业管理”>“Flink作业”页面，单击对应的作业名称，进入作业详情页面，单击“运行日志”可以查看实时日志。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

单击“确定”完成添加队列配置。步骤4：创建增强型跨源连接在RDS实例所在的安全组上放通DLI队列网段在RDS管理控制台，在RDS实例列表页单击对应的RDS实例名称，进入到RDS实例的基本信息页面。单击“连接管理”配置安全组规则，在“入方向规则”中添加放通队列网段的规则。例如，本示例队列网段为“172

帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 265

上一页
1
...
9
10
11
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

创建消息通知主题 - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线