搜索_华为云

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

升级引擎版本后是否对作业有影响：功能增强，无影响默认配置spark.sql.adaptive.enabled=true 说明： Spark2.4.x：在Spark 2.4.x版本中，默认情况下spark.sql.adaptive.enabled配置项的值是false，即自适应查询执行（Adaptive

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
CREATE TABLE语句 - 数据湖探索 DLI

原始字段的类型不是 TIMESTAMP(3) 或嵌套在 JSON 字符串中。注意：定义在一个数据源表（ source table ）上的计算列会在从数据源读取数据后被计算，它们可以在 SELECT 查询语句中使用。计算列不可以作为 INSERT 语句的目标，在 INSERT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

'时需配置，格式为: 'partition:0,offset:42;partition:1,offset:300'。 connector.startup-timestamp-millis 否指定起始消费时间戳，'startup-mode'为'timestamp'时需配置。 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

自动续费的到期前7日自动扣款属于系统默认配置，您也可以根据需要修改此扣款日，如到期前6日、到期前5日等等。更多关于自动续费的规则介绍请参见自动续费规则说明。前提条件请确认包年/包月资源还未到期。在购买页面开通自动续费您可以在购买页面开通自动续费，如图1所示。图1 自动续费配置在续费管理页面开通自动续费

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
SQL作业运行慢如何定位 - 数据湖探索 DLI

ORDER BY count desc; 从图11可以看出，num为1的数量远大于其他值的数量。图11 示例数据统计演示考虑在对应key值上添加concat(cast(round(rand() * 999999999) as string)随机数进行打散。如果确实因为单个key

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hudi数据表Compaction规范 - 数据湖探索 DLI

tion作业CPU与内存的比例按照1:4~1:8配置，保证Compaction作业稳定运行。当Compaction出现OOM问题，可以通过调大内存占比解决。建议通过增加并发数提升Compaction性能。 CPU和内存比例配置合理会保证Compaction作业是稳定的，实现单个Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DLI程序包标签管理 - 数据湖探索 DLI

标签”，显示当前程序包组或程序包的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框。在“添加/编辑标签”对话框中配置标签参数。表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预先在标签管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

最后修改时间作业运行完成的时间。操作编辑：可修改当前作业配置，重新执行作业。 SparkUI：单击后，将跳转至Spark任务运行情况界面。说明：状态为“启动中”的作业不能查看SparkUI界面。目前DLI配置SparkUI只展示最新的100条作业信息。终止作业：终止启动中和运行中的作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

具有一项安全检查，用于防止运行危险的VACUUM命令，当指定保留期阈值少于168小时时会报错限制该操作。如果确定指定保留期阈值进行vacuum操作，可通过将 Spark 配置属性 spark.databricks.delta.retentionDurationCheck.enabled 设置为 false 来关闭此安全检查。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源池扩缩容策略生效规则为：在任意一个时间段周期内，优先满足所有队列的最小CU数，剩余的CU（弹性资源池最大CU-所有队列的最小CU数之和）则根据配置的优先级顺序分配，直到剩余的CU数分配完成。队列扩容成功

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

'print-identifier' = '', --配置数据前缀 'standard-error' = 'false', --输出数据到taskmanager的out文件中 'sink.parallelism' = '2' --配置并行度 ); insert into printSink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建消息通知主题 - 数据湖探索 DLI

如果单个队列和所有队列的终端不一致，当选择了单个队列，同时选择了所有队列进行订阅时，在所有队列的消息通知中将不包含该队列的消息。创建消息通知主题后，只有在订阅队列上创建的Spark作业失败时才会收到消息通知。图2 创建主题成功单击图2中“主题管理”，跳转至消息通知服务“主题管理”页面。图3 主题管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

数据的具体格式通过调用ImportJob对象的setCsvFormatInfo接口进行设置。在提交导入作业前，可选择设置导入数据的分区并配置是否是overwrite写入，分区信息可以调用ImportJob对象的setPartitionSpec接口设置，如：importJob.setPartitionSpec(new

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

STREAMING 不断写入，向Hive添加新数据，以增量方式提交记录使其可见。用户控制何时/如何触发具有多个属性的提交。流式写入不支持插入覆盖。有关可用配置的完整列表，请参阅流式处理接收器。Streaming sink 前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

确认客户esdk-obs-java-3.1.3.jar的版本。确认是集群存在问题。处理步骤设置依赖关系provided。重启clusteragent应用集群升级后的配置。去掉OBS依赖，否则checkpoint会写不进OBS。父主题： Flink Jar作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

compaction命令时，禁止将hoodie.run.compact.only.inline设置成false，该值需要设置成true。错误示例：配置参数 hoodie.run.compact.only.inline=false 随后执行SQL run compaction on dsrTable;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Hudi表模型设计规范 - 数据湖探索 DLI

通过Spark Datasource API或者Flin写Hudi表的场景，通过这两种方式写Hudi时需要增加向Hive同步元数据的配置项；该配置的目的是将Hudi表的元数据统一托管到Hive元数据服务中，为后续的跨引擎操作数据以及数据管理提供便利。父主题： Hudi数据表设计规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
执行SQL查询语句报错：DLI.0003: Permission denied for resource.... - 数据湖探索 DLI

'SELECT'. 解决措施出现该问题的原因是由于当前用户没有该表的查询权限。您可以进入“数据管理 > 库表管理”查找对应库表，查看权限管理，是否配置该账号的查询权限。授权方式请参考资料表权限管理。父主题： DLI权限管理类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
导入Flink作业 - 数据湖探索 DLI
导入Flink作业 - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。请求消息表2 请求参数说明参数名称是否必选参数类型说明 zip_file 是 String 从OBS上导入的作业zip文件路径，支持填写文件夹，导入文件夹下的所有zip文件。说明：文件夹中只能包含zip文件。 is_cover 否 Boolean

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 821

上一页
1
...
35
36
37
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

DLI程序包标签管理 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

Print - 数据湖探索 DLI

创建消息通知主题 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

执行SQL查询语句报错：DLI.0003: Permission denied for resource.... - 数据湖探索 DLI

导入Flink作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线