搜索_华为云

产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

Spark、Apache Flink生态和接口，是集实时分析、离线分析、交互式分析为一体的Serverless大数据计算分析服务。线下应用可无缝平滑迁移上云，减少迁移工作量。采用批流融合高扩展性框架，为TB~EB级数据提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。产品内核及架构深度优

 帮助中心 > 数据湖探索 DLI > 产品介绍
下载并安装JDBC驱动包 - 数据湖探索 DLI

X版本功能重构后，仅支持从DLI作业桶读取查询结果，如需使用该特性需具备以下条件：在DLI管理控制台“全局配置 > 工程配置”中完成作业桶的配置。 2024年5月起，新用户可以直接使用DLI服务的“查询结果写入桶”功能，无需开通白名单。对于2024年5月之前开通并使用DLI服

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项，因此可以显著减少磁盘上的存储。使用DLI可轻松将CSV格式数据转换为Parquet格式数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
添加Flink作业标签 - 数据湖探索 DLI

标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : +-@ ,但首尾不能含有空格，不能以_sys_开头。标签值您可以选择：在输入框的下拉列表中选择预定义标签值。在输入框中输入标签值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

规则说明。前提条件请确认包年/包月资源还未到期。在购买页面开通自动续费您可以在购买页面开通自动续费，如图1所示。图1 自动续费配置在续费管理页面开通自动续费登录管理控制台。单击“控制台”页面上方“费用与成本”，在下拉菜单中选择“续费管理”。进入“续费管理”页面。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的剩余可用CUs，才可以确保作业任务的正常执行。本节操作介

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

在SQL作业列表页面查看作业的基本信息 DLI SQL作业管理页面显示所有SQL作业，作业数量较多时，系统分页显示，可根据需要跳转至指定页面。您可以查看任何状态下的作业。作业列表默认按创建时间降序排列。表1 作业管理参数参数参数说明队列作业所属队列的名称。执行引擎 SQL作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
监控安全风险 - 数据湖探索 DLI

控账号下的DLI队列，执行自动实时监控、告警和通知操作。用户可以实时掌握队列中的运行作业网络流入速率、网络流出速率、CPU使用率、内存使用率、磁盘利用率、失败作业率、等待作业数等信息。还可以通过云监控服务提供的管理控制台或API接口来检索数据湖探索服务产生的监控指标和告警信息。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

的计算引擎。历史创建的队列仍然可以使用Flink 1.10、Flink1.11执行作业，但作业执行过程中出现的错误，不再提供该版本的任何技术服务支持，请您尽快更换至新版本的计算引擎。 Flink 1.10、Flink1.11版本停止服务后，可以使用哪个版本替换？推荐使用DLI

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI对接LakeFormation - 数据湖探索 DLI

步骤2：在LakeFormation管理控制台创建Catalog 数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。您可以在LakeFormation中创建并管理多个Catalog，用于不同外部集群的元数据隔离。登录LakeFormation管理控制台。选择“元数据 > Catalog”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

是Throughput 测试的结果，被定义为所有查询执行时间平均值的倒数，公式如下：业务场景用户可以通过DLI内置的TPC-H测试套件进行简单高效的交互式查询，无需用户上传数据，即可以体验DLI的核心功能。 DLI内置TPC-H的优势用户只需要登录DLI，完成授予权限，即可操作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.partitions参数值来解决缓冲区不足问题。具体该参数设置步骤如下：登录DLI管理控制台，单击“作业管理 > SQL作业”，对应SQL作业行的操作列，单击“编辑”按钮，跳转到“SQL编辑器”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
DLI Delta元数据 - 数据湖探索 DLI

DLI元数据可在数据湖探索管理控制台的“数据管理 > 库表管理”中查看。 Lakeformation元数据可在湖仓构建Lakeformation服务的管理控制台中查看。相关操作 DLI SQL队列对接DLI元数据方法：在DLI管理控制台的SQL编辑器页面的“数据目录”中选择“dli”。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
变更普通队列规格 - 数据湖探索 DLI

才可进行扩缩容。扩容当前队列规格不满足业务需要时，可以通过手动变更队列规格来扩容当前队列。扩容属于耗时操作，在DLI“规格变更”页面执行扩容操作后，需要等待大约10分钟，具体时长和扩容的CU值有关，等待一段时间后，可以通过刷新“队列管理”页面，对比“规格”和“实际CUs”大

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
怎样将老版本的Spark队列切换成通用型队列 - 数据湖探索 DLI

老版本的Spark队列，用于运行Spark作业和Flink作业。通过以下步骤，可以将老版本的“Spark队列”转换为新的“通用队列”。重新购买“通用队列”。将在旧的“Spark队列”中的作业迁移到新的“通用型队列”中，即在提交Spark作业时指定新的队列。释放旧的“Spark队列”，即删除或退订队列。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

参数值可以是 'sequence' 或 'random'，具体含义如下： random是默认的生成器，您可以通过“fields.#.max”和“fields.#.min”参数指定随机生成的最大和最小值。当指定的字段类型为char、varchar、string时，可以同时通过“fields

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

上传Jar包到OBS和DLI OBS控制台 DLI控制台将生成的Spark Jar包文件上传到OBS目录下和DLI程序包中。 7 创建Spark Jar作业 DLI控制台在DLI控制台创建Spark Jar作业并提交运行作业。 8 查看作业运行结果 DLI控制台查看作业运行状态和作业运行日志。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
创建DLI自定义委托权限 - 数据湖探索 DLI

访问凭证、允许访问Catalog获取元数据等场景。以上场景的委托权限请参考常见场景的委托权限策略。步骤1：在IAM控制台创建云服务委托并授权登录管理控制台。单击右上方登录的用户名，在下拉列表中选择“统一身份认证”。在左侧导航栏中，单击“委托”。在“委托”页面，单击“创建委托”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
字符串函数概览 - 数据湖探索 DLI

])，concat(string <str1>, string <str2>[,...]) ARRAY或STRING 连接多个字符串，合并为一个字符串，可以接受任意数量的输入字符串。 concat_ws concat_ws(string <separator>, string <str1>, string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

登录DLI管理控制台，在“SQL编辑器”中，单击“设置”。在参数设置中，添加参数“spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled”，值设置为“false”。图1 参数设置上述步骤参数设置完成后，则可以进行全表查询，不用查询表的时候要包含分区字段。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类

总条数： 398

上一页
1
...
15
16
17
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

产品优势 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

添加Flink作业标签 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

监控安全风险 - 数据湖探索 DLI

DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

DLI Delta元数据 - 数据湖探索 DLI

变更普通队列规格 - 数据湖探索 DLI

怎样将老版本的Spark队列切换成通用型队列 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线