搜索_华为云

OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Hudi Clustering操作说明 - 数据湖探索 DLI

间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

compaction命令时，禁止将hoodie.run.compact.only.inline设置成false，该值需要设置成true。错误示例：配置参数 hoodie.run.compact.only.inline=false 随后执行SQL run compaction on

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

ne顺序执行各个节点。请参考步骤4：作业编排。测试作业运行：测试作业运行。请参考步骤5：测试作业运行。设置作业调度与监控：设置作业调度属性与监控规则。请参考步骤6：设置作业周期调度和相关操作。环境准备 DLI资源环境准备配置DLI作业桶使用DLI服务前需配置DLI作业桶

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在DLI控制台创建数据库和表 - 数据湖探索 DLI

在DLI控制台创建数据库和表数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。表是数据库最重要的组成部分之一。表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

安全组限制实例的安全访问规则，加强云数据库RDS服务与其他服务间的安全访问。数据源的安全组需放通DLI弹性资源池的网段。 - 设置密码设置实例的登录密码。 - 管理员账号 root root 管理员密码设置管理员密码。 - 参数模板数据库参数模板就像是数据库引擎配置值的容器，参数模板中的参数可应用于一个或多个相同类型的数据库实例。

帮助中心 > 数据湖探索 DLI > 快速入门
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，要与kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

它能提升写入HBase数据库的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。注意："sink.buffer-flush.max-size" 和 "sink.buffer-flush.max-rows" 同时设置为 "0"，并设置刷新缓存的间隔，则以完整的异步处理方式刷新缓存。格式为：{length

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

激活队列扩缩容定时任务。默认开启。如果关闭，则系统不会触发执行当前设置的定时规格变更任务。有效期设置执行定时任务的时间段。包括“日期”和“时间”。说明： “有效期”中的“开始时间”需要晚于当前的系统时间。如果只设置了扩容，在“有效期”结束之后，系统不会自动缩容，需要手动修改或设置缩容定时任务。反之亦然。即为单次执行定时扩缩容。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

Executor CPU核数用于设置Spark作业申请的每个Executor的CPU核数，决定每个Executor并行执行Task的能力。 Executor个数用于设置Spark作业申请的Executor的数量。 driver CPU核数用于设置driver CPU核数。 driver内存

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Confluent Avro Format - 数据湖探索 DLI

根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试地址连通性-->输入kafka或ecs的地址-->

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

ming sink 前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Delta常见配置参数 - 数据湖探索 DLI

Delta常见配置参数提交DLI Spark SQL作业时，在“SQL编辑器”界面右上角的“设置 > 参数设置”中配置Delta参数。表1 Delta常见配置项参数描述默认值 spark.databricks.delta.retentionDurationCheck.enabled

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统问题现象客户执行Flink Jar作业，通过设置checkpoint存储在OBS桶中，作业一直提交失败，并伴有报错提交日志，提示OBS桶名不合法。原因分析确认OBS桶名是否正确。确认所用AKSK是否有权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
DWS结果表（不推荐使用） - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
查询Flink作业日志 - 数据湖探索 DLI

避免出现作业结果混乱等问题。 DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查询SQL作业日志 - 数据湖探索 DLI

避免出现作业结果混乱等问题。 DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
添加分区（只支持OBS表） - 数据湖探索 DLI

ADD [IF NOT EXISTS] PARTITION partition_specs1 [LOCATION 'obs_path1'] PARTITION partition_specs2 [LOCATION 'obs_path2']; 关键字 IF NOT EX

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

它能提升写入HBase数据库的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。注意："sink.buffer-flush.max-size" 和 "sink.buffer-flush.max-rows" 同时设置为 "0"，并设置刷新缓存的间隔，则以完整的异步处理方式刷新缓存。格式为：{length

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
查询Spark作业日志 - 数据湖探索 DLI

避免出现作业结果混乱等问题。 DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业

总条数： 480

上一页
1
...
8
9
10
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPTIMIZE - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

Delta常见配置参数 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线