搜索_华为云

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

2版本停止服务后，正在使用该版本的作业有哪些影响？在Spark 2.3.2 EOS时间后创建的队列，在执行作业时不支持选择已经EOS的计算引擎。历史创建的队列仍然可以使用Spark 2.3.2执行作业，但作业执行过程中出现的错误，不再提供该版本的任何技术服务支持，请您尽快更换至新版本的计算引擎。 DLI

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Spark jar 如何读取上传文件 - 数据湖探索 DLI

–-file中提交上来的文件的本地路径，即：SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的路径作为参数传给Executor去执行。 Executor获取文件路径的时候，仍然需要使用SparkFiles

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查看队列的基本信息 - 数据湖探索 DLI

在列表页面上方的搜索区域，您可以名称和标签筛选需要的队列资源。单击查看队列的详细信息。关于队列引擎相关字段的含义：执行引擎：负责执行队列中任务的引擎类型。默认版本：执行引擎的默认配置版本，或者是在没有指定特定版本时系统将使用的版本。支持版本：执行引擎支持的所有版本列表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？问题描述需要查看DLI的队列中作业状态为“提交中”和“运行中”的作业数，判断当前队列中的作业是否有积压。解决方案可以通过“云监控服务 CES”来查看DLI队列中不同状态的作业情况，具体操作步骤如下：在控制台搜索“云监控服务 CES”，进入云监控服务控制台。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
弹性资源池权限管理 - 数据湖探索 DLI

回收：当前用户可回收其他用户具备的该弹性资源池的权限，但不能回收该弹性资源池所有者的权限。查看其他用户具备的权限：当前用户可查看其他用户具备的该弹性资源池的权限。为已有权限的用户赋予权限或回收权限。在对应弹性资源池“权限信息”区域的用户列表中，选择需要修改权限的用户，在“操作”列单击“权限设置”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
普通队列弹性扩缩容 - 数据湖探索 DLI

容到设定的目标大小。队列资源缩容时，系统不保证将队列资源完全缩容到设定的目标大小。通常队列资源缩容时，系统会先检查资源使用情况，判断是否存在缩容空间，如果现有资源无法按照最小缩容步长执行缩容任务，则队列可能缩容不成功，或缩容一部分规格的情况。因资源规格不同可能有不同的缩容步长

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
修改普通队列的网段 - 数据湖探索 DLI

修改普通队列的网段使用增强型跨源时，如果DLI队列的网段和用户数据源的网段发生冲突，您可以通过修改网段操作更改包年包月队列的网段。如果待修改网段的队列中有正在提交或正在运行的作业，或者该队列已经绑定了增强型跨源，将不支持修改网段操作。本节操作仅适用于普通队列，不适用于弹性资源池队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
CREATE SCHEMA - 数据湖探索 DLI
CREATE SCHEMA - 数据湖探索 DLI

rty_value,...)] 描述创建一个空的schema。schema是表、视图以及其他数据库对象的容器。当指定可选参数IF NOT EXISTS时，如果系统已经存在同名的schema，将不会报错。示例创建一个名为web的schema： CREATE SCHEMA web;

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
查看弹性资源池的基本信息 - 数据湖探索 DLI

查看弹性资源池的基本信息资源池创建完成后您可以通过管理控制台查看和管理您的弹性资源池。本节操作介绍在管理控制台如何查看弹性资源池基本信息，包括弹性资源池的VPC网段、IPv6网段、创建时间等信息。查看弹性资源池的基本信息登录DLI管理控制台。选择“资源管理 > 弹性资源池”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
本文样例表数据准备 - 数据湖探索 DLI

--创建一个新视图来替换已经存在的视图: CREATE OR REPLACE VIEW test_view AS SELECT orderkey, orderstatus, totalprice / 4 AS quarter FROM orders; --更改已存在表的定义。 --数据准备

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > 附录
数据迁移与传输方式概述 - 数据湖探索 DLI

CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。图1 迁移数据至DLI 配置DLI读写外部数据源如果您不想将数据导入OBS或DLI的数据表中，DLI提供的跨源访问能力，支持您在不迁移数据的情况下，连接数据源获取数据并进行数据分析。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
设置SQL作业优先级 - 数据湖探索 DLI

操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个SQL设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。使用须知对于每个作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
设置Spark作业优先级 - 数据湖探索 DLI

在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。 Spark 2.4

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
查看增强型跨源连接的基本信息 - 数据湖探索 DLI

是否支持IPv6：如果创建增强型跨源连接时您选择的子网是开启IPv6的，则您创建的增强型跨源连接也是支持IPv6的。主机信息：访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。详细信息请参考修改弹性资源池的主机信息。图1 增强型跨源连接基本信息父主题：管理增强型跨源连接

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

该操作修改了作业对资源的算法逻辑。例如原有的算法的语句是执行加减运算，当前需要恢复的状态将算法的语句修改成为乘除取余的运算，是无法从checkpoint直接恢复的。修改“静态流图” 不支持该操作修改了作业对资源的算法逻辑。修改“单TM所占CU数”参数支持对计算资源的修改并没有影响到作业算法或算子的运行逻辑。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

Tool），是一款开源的数据建模和转换工具，运行在Python环境上。DBT连接DLI，用来定义和执行SQL转换，支持从数据集成、转换到分析的整个数据生命周期管理，适用于大规模数据分析项目和复杂的数据分析场景。本节操作介绍DBT连接DLI的操作步骤。操作前准备环境要求确保您的系统环境满足以下要求。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 配置BI工具连接DLI进行数据查询和分析
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

窗口偏移 Offset 可选参数，可以用来改变窗口的分配。可以是正或者负的区间。默认情况下窗口的偏移是 0。不同的偏移值可以决定记录分配的窗口。例如：在 10 分钟大小的滚动窗口下，时间戳为 2021-06-30 00:00:04 的数据会被分配到哪个窗口呢？当 offset 为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

Id); System.out.println(result); } 查询作业执行计划图 DLI提供查询Flink作业执行计划图的接口。您可以使用该接口查询作业的执行计划图。示例代码如下： 1 2 3 4 5 private static void getFlinkJ

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

com/v3/projects" } } 从控制台获取项目ID 从控制台获取项目ID的步骤如下：登录管理控制台。鼠标悬停在右上角的用户名，选择下拉列表中的“我的凭证”。在“API凭证”页面的项目列表中查看项目ID。图1 查看项目ID 父主题：公共参数

 帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Beeline是数据分析师和数据工程师的重要工具之一，适用于大规模数据处理的场景。Beeline提供了的SQL引擎，使得用户可以使用SQL的语言来执行数据查询、数据分析和管理任务。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 配置BI工具连接DLI进行数据查询和分析

总条数： 532

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

查看队列的基本信息 - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

弹性资源池权限管理 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

修改普通队列的网段 - 数据湖探索 DLI

CREATE SCHEMA - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

本文样例表数据准备 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

查看增强型跨源连接的基本信息 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线