搜索_华为云

（推荐）DLI SDK V3 - 数据湖探索 DLI

（推荐）DLI SDK V3 写作说明本文介绍了DLI服务提供的V3版本的SDK，列举了最新版本SDK的获取地址。 SDK列表表1提供了DLI云服务支持的SDK列表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。表1 SDK列表编程语言 Github地址

 帮助中心 > 数据湖探索 DLI > SDK参考
Hudi表索引设计规范 - 数据湖探索 DLI

实时入湖都是需要分钟内或者分钟级的高性能入湖，索引的选择会影响到写Hudi表的性能。在性能方面各个索引的区别如下： Bucket索引优点：写入过程中对主键进行hash分桶写入，性能比较高，不受表的数据量限制。Flink和Spark引擎都支持，Flink和Spark引擎可以实现交叉混写同一张表。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
为什么已有View视图的select权限，但是查询不了View？ - 数据湖探索 DLI

为什么已有View视图的select权限，但是查询不了View？问题描述用户A创建了表Table1。用户B基于Table1创建了视图View1。赋予用户C Table1的查询表权限后，用户C查询View失败。根因分析用户C查询View失败的原因是由于用户B不具备Table1的查询表权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库问题描述 Spark3.x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
弹性资源池规格变更 - 数据湖探索 DLI

弹性资源池规格变更使用场景包年包月的弹性资源池CU数在规格（包周期CU）的范围内使用包年包月计费，超过规格（包周期CU）的部分则按弹性资源池CU时计费的方式计费，您可以根据实际CU的使用情况通过规格变更来使得计费更优惠。例如，当前弹性资源池的规格（包周期CU）为64CU，实际使

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Python SDK环境配置 - 数据湖探索 DLI

Studio ”，可能是由于缺少C++编译器导致的报错，建议您根据提示信息安装相应版本的Visual Studio编译器解决。部分操作系统Visual Studio安装后需重启才可以生效。安装DLI服务Python SDK。选择SDK获取与安装获取的安装包，解压安装包。将"dli-sdk-python-<version>

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
修改表生命周期的时间 - 数据湖探索 DLI

修改表生命周期的时间功能描述修改已存在的分区表或非分区表的生命周期。当第一次开启生命周期时，会扫描表/分区会扫描路径下的表数据文件，更新表/分区的LAST_ACCESS_TIME，耗时与分区数和文件数相关。约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

新购买新的队列。管理队列不支持切换队列的计费模式。队列不支持切换区域。创建队列时（非弹性资源池模式的队列），仅支持包年包月队列和按需专属队列选择跨AZ双活，且跨AZ的队列价格为单AZ模式下的2倍。 DLI队列不支持访问公网。队列扩缩容 16CUs队列不支持扩容和缩容。 64CUs队列不支持缩容。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？可以使用OBS跨区域复制功能实现，步骤如下：将区域一中的DLI表数据导出到自定义的OBS桶中。具体请参考《数据湖探索用户指南》。通过OBS跨区域复制功能将数据复制至区域二的OBS桶中。具体请参考跨区域复制。根据需要导入或使用对应的数据。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

使用方式将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后单击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？场景概述用户使用Flink SQL作业时，需要创建OBS分区表，用于后续进行批处理。操作步骤该示例将car_info数据，以day字段为分区字段，parquet为编码格式，转储数据到OBS。更多内容请参考《数据湖探索Flink SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

k Jar，并指定主类。主要参数的填写说明：所属队列：选择Flink Jar作业运行的队列。应用程序：自定义的程序包主类：指定类名：输入类名并确定类参数列表（参数间用空格分隔）。其他依赖文件：自定义的依赖文件。选择2和4导入的jks和properties文件。 Flink版本：1

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

容，显著提升扩缩容的成功率和操作效率。在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。在全天的任意一个时间段内，弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。同一队列不同扩缩容策略的时间段区间不能有交集。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

default队列是系统预置的默认公共队列，主要用来体验产品功能。当多个用户通过该队列提交作业时，容易发生流控，从而导致作业提交失败。解决方案建议不要使用default队列提交作业，可以在DLI控制台新购买SQL队列来提交作业。了解更多新建队列的操作指导请参考创建弹性资源池并添加队列。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
按需计费的弹性资源池，如果没提交作业运行就不计费？ - 数据湖探索 DLI

按需计费的弹性资源池，如果没提交作业运行就不计费？按需计费的弹性资源池默认勾选专属资源模式，自创建起按自然小时收费。无作业运行仍正常收费。按实际CU进行计费，秒级计费，按小时结算。按需弹性资源池创建成功一小时后方可删除。父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
修改弹性资源池关联队列的扩缩容策略 - 数据湖探索 DLI

queue_name 是 String 绑定的队列名称。请求消息表2 请求参数说明参数是否必选参数类型描述 queue_scaling_policies 是 Array of objects 该队列在该弹性资源池下的扩缩容策略信息。单条策略信息包含时间段、优先级和CU范围。每个队列至少要配置一条时间段为[00:00

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
禁止或恢复表的生命周期 - 数据湖探索 DLI

否禁止表或指定分区的生命周期功能。禁止表本身及其所有分区被生命周期回收，优先级高于恢复表分区生命周期。即当使用禁止表或指定分区的生命周期功能时，设置待禁止或恢复生命周期的表的分区信息是无效的。禁止表的生命周期功能后，表的生命周期配置及其分区的enable和disable标记会被保留。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

建avro类型的OBS表创建失败问题描述使用Spark访问元数据时，DataSource语法创建avro类型的OBS表创建失败。图1 avro类型的OBS创建失败根因分析当前Spark2.3.x不支持创建avro类型的OBS表，Spark2.4.x及以上的版本支持avro类型的OBS表。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
创建表时指定表的生命周期 - 数据湖探索 DLI

创建表时指定表的生命周期功能描述 DLI提供了表生命周期管理功能，在创建表时指定表的生命周期。DLI会根据每张表的最后修改时间和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置，避免因误操作丢失数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况查看Spark作业原始资源配置登录DLI 控制台，单击左侧“作业管理”>“Spark作业”，在作业列表中找到需要查看的Spark作业，单击“作业ID”前的，即可查看对应Spark作业的原始资源配置参数。在创建Spark作业时，

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 1041

上一页
1
...
12
13
14
...
53
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

（推荐）DLI SDK V3 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

为什么已有View视图的select权限，但是查询不了View？ - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

弹性资源池规格变更 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

按需计费的弹性资源池，如果没提交作业运行就不计费？ - 数据湖探索 DLI

修改弹性资源池关联队列的扩缩容策略 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线