搜索_华为云

创建并提交Spark作业 - 数据湖探索 DLI

本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。查询组内资源包：确认上传的资源包是否正确。创建批处理作业：创建并提交Spark批处理作业。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
普通队列弹性扩缩容 - 数据湖探索 DLI

容到设定的目标大小。队列资源缩容时，系统不保证将队列资源完全缩容到设定的目标大小。通常队列资源缩容时，系统会先检查资源使用情况，判断是否存在缩容空间，如果现有资源无法按照最小缩容步长执行缩容任务，则队列可能缩容不成功，或缩容一部分规格的情况。因资源规格不同可能有不同的缩容步长

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
DLI常用管理操作 - 数据湖探索 DLI

DLI常用管理操作使用自定义镜像增强作业运行环境管理DLI全局变量管理Jar作业程序包管理DLI资源配额

 帮助中心 > 数据湖探索 DLI > 用户指南
SQL作业运维类 - 数据湖探索 DLI

Buffer size too small. size SQL作业运行报错：DLI.0002 FileNotFoundException 用户通过CTAS创建hive表报schema解析异常错误在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较）。结果中包含一行的概率与任何其他行无关。这不会减少从磁盘读取采样表所需的时间。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
查询作业详情 - 数据湖探索 DLI

定作业运行使用自定义的Flink镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 feature 否 String 自定义作业特性。表示用户作业使用的Flink镜像类型。 basic：表示使用DLI提供的基础Flink镜像。 custom：表示使用用户自定义的Flink镜像。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
将OBS数据导入至DLI - 数据湖探索 DLI

有两种方式可查看导入的数据。目前预览只显示导入的前十条数据。在“数据管理”>“库表管理”页面，单击数据库名，在表管理界面对应表的“操作”栏选择“更多”中的“表属性”，在弹框的“预览”页签中，可查看导入的数据在“SQL编辑器”的“数据库”页签中，单击数据库名称，进入对应的表列表，鼠标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
DLI API类 - 数据湖探索 DLI
DLI API类 - 数据湖探索 DLI

如何获取AK/SK？如何获取项目ID？提交SQL作业时，返回“unsupported media Type”信息创建SQL作业的API执行超过时间限制，运行超时报错 API接口返回的中文字符为乱码，如何解决？

帮助中心 > 数据湖探索 DLI > 常见问题
创建Hbase维表 - 数据湖探索 DLI
创建Hbase维表 - 数据湖探索 DLI

如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。语法格式 create table hbaseSource (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通背景信息 DLI与内网数据源的网络联通通常指的是华为云内部服务的场景，例如DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。使用DLI提供的增强型跨源连接，采用对等连接的方式打通DLI与目的数据源的VPC网络，实现数据互通。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Hudi数据表Compaction规范 - 数据湖探索 DLI

新版本的Parquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Flink作业相关API - 数据湖探索 DLI

新建Flink Jar作业更新Flink Jar作业批量运行作业查询作业列表查询作业详情查询作业执行计划批量停止作业删除作业批量删除作业导出Flink作业导入Flink作业生成Flink SQL作业的静态流图

 帮助中心 > 数据湖探索 DLI > API参考
Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

到DLI管理控制台，左侧导航栏选择“作业管理 > Flink作业”，在对应的Flink作业所在行，操作列下单击“编辑”。在“运行参数”下，查看“开启Checkpoint”参数是否开启。图1 开启Checkpoint 确认Flink结果表的表结构和DLI分区表的表结构是否保持一致。如问题描述中car_inf

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
创建弹性资源池和队列 - 数据湖探索 DLI

创建弹性资源池和队列 DLI弹性资源池与队列简介创建弹性资源池并添加队列管理弹性资源池管理队列典型场景示例：创建弹性资源池并运行作业典型场景示例：配置弹性资源池队列扩缩容策略创建非弹性资源池队列（废弃，不推荐使用）

帮助中心 > 数据湖探索 DLI > 用户指南
弹性资源池关联队列 - 数据湖探索 DLI

关联至弹性资源池，即可将弹性资源池的资源用于后续作业的运行您可以在弹性资源池页面通过“关联队列”将队列添加到弹性资源池。还可以在队列管理页面分配队列至弹性资源池。弹性资源池Flink版本只支持1.10及其以上版本，如果准备分配到弹性资源池的作业使用Flink1.7版本可能会出

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

产品规格弹性资源池产品规格弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DLI弹

 帮助中心 > 数据湖探索 DLI > 产品介绍
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

建议对流批业务实施资源池的精细化管理，将Flink实时流类型的作业与SQL批处理类型的作业分别置于独立的弹性资源池中。优势在于：Flink实时流任务具有常驻运行的特质，确保其稳定运行而不会强制缩容，进而避免任务中断和系统不稳定。而SQL批处理类型的作业在独立的资源池中能够更加灵活

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Flink Jar作业类 - 数据湖探索 DLI

Flink Jar 包冲突，导致作业提交失败 Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 Flink Jar作业运行报错，报错信息为Authentication failed Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 Hadoop

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
Delta常见配置参数 - 数据湖探索 DLI

deletedFileRetentionDuration Delta不再引用的文件的保留期。当spark.databricks.delta.retentionDurationCheck.enabled为true时，清空未超过保留期的文件将会抛出异常。 168小时（1周） spark.databricks

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
在DLI控制台删除数据库 - 数据湖探索 DLI

注意事项具有正在运行中的作业的数据库或者表不能删除。管理员用户、数据库的所有者和具有删除数据库权限的用户可以删除数据库。数据库和表删除后，将不可恢复，请谨慎操作。删除数据库在管理控制台左侧，单击“数据管理”>“库表管理”。单击需要删除的数据库“操作”栏中的“更多 > 删除数据库”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源

总条数： 499

上一页
1
...
19
20
21
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建并提交Spark作业 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

DLI常用管理操作 - 数据湖探索 DLI

SQL作业运维类 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

DLI API类 - 数据湖探索 DLI

创建Hbase维表 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Flink作业相关API - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

创建弹性资源池和队列 - 数据湖探索 DLI

弹性资源池关联队列 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

Flink Jar作业类 - 数据湖探索 DLI

Delta常见配置参数 - 数据湖探索 DLI

在DLI控制台删除数据库 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线