搜索_华为云

Delta清理和优化 - 数据湖探索 DLI

Delta清理和优化清理Delta表可以对 Delta 表运行 VACUUM 命令，以删除该表中不再引用且在保留期阈值之前创建的数据文件。 VACUUM delta_table0; VACUUM delta_table0 RETAIN 168 HOURS;--单位只支持HOURS

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

I SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算资源按租户隔离，数据权限控制到队列、作业，帮助企业实现部门间的数据共享和权限管理。 Serverless DLI DLI完全兼容Apache

帮助中心 > 数据湖探索 DLI > 产品介绍
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE 命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.forceP

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

高的压缩比，导致解压后单个任务处理的数据量过大。但调整这个参数可能会影响到作业的执行效率和资源消耗，因此在做调整时需要根据实际的数据量和压缩率来选择适合的参数值。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代

 帮助中心 > 数据湖探索 DLI > 用户指南
使用DLI分析账单消费数据 - 数据湖探索 DLI

的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：步骤1：获取消费数据。获取账户的实际消费数据。步骤2：分析账户消费结构并优化。在DLI上分析账户消费结构，找出开支

 帮助中心 > 数据湖探索 DLI > 最佳实践
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

paction之后新增的数据。读优化查询读优化查询（Read Optimized Queries）是针对MOR表进行的优化，只会读取最新的commit/compaction产生的快照（不包含delta log文件）。表1 实时查询和读优化查询的trade-off Trade-off

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
权限策略和授权项 - 数据湖探索 DLI

服务进行操作。权限根据授权的精细程度，分为角色和策略。角色：角色以服务为粒度，是IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。策略：策略以API接口为粒度进行权限拆分，授权更加精细，可以精确到某个操作、资源和条件，能够满足企业对权限最小化的安全管控要求。

帮助中心 > 数据湖探索 DLI > API参考
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

启。作业模板内置多个常见Flink SQL通用场景模板，帮助您快速了解和构建作业代码暂无企业安全访问控制与华为云IAM权限打通，支持多角色的访问控制暂无空间隔离支持租户级和项目级的资源和代码隔离，满足多团队协作需求暂无父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。本例介绍通过DLI控制台提交Jar作业

 帮助中心 > 数据湖探索 DLI > 快速入门
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

目前仅支持 equi-join ，即 join 的联合条件至少拥有一个相等谓词。不支持任何 cross join 和 theta join。 Join 的顺序没有进行优化，join 会按照 FROM 中所定义的顺序依次执行。请确保 join 所指定的表在顺序执行中不会产生不支持的 cross

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

目前仅支持 equi-join ，即 join 的联合条件至少拥有一个相等谓词。不支持任何 cross join 和 theta join。 Join 的顺序没有进行优化，join 会按照 FROM 中所定义的顺序依次执行。请确保 join 所指定的表在顺序执行中不会产生不支持的 cross

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

目前仅支持 equi-join ，即 join 的联合条件至少拥有一个相等谓词。不支持任何 cross join 和 theta join。 Join 的顺序没有进行优化，join 会按照 FROM 中所定义的顺序依次执行。请确保 join 所指定的表在顺序执行中不会产生不支持的 cross

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
file - 数据湖探索 DLI
file - 数据湖探索 DLI

目前包含以上6种格式。指定数据格式的方式有两种，一种是USING，可指定以上6种数据格式，另一种是STORED AS，只能指定ORC和PARQUET。 ORC对RCFile做了优化，可以提供一种高效的方法来存储Hive数据。 PARQUET是面向分析型业务的列式存储格式。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
Spark 3.3.1版本说明 - 数据湖探索 DLI

支持动态加载UDF（公测）无需重启队列UDF即可生效。 Spark UI支持火焰图 Spark UI支持绘制火焰图。优化SQL作业NOT IN语句查询性能 NOT IN语句查询性能提升。优化Multi-INSERT语句查询性能 Multi-INSERT语句查询性能提升。父主题：版本支持公告

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

OpenSource SQL 1.15时请注意以下使用说明。 Flink SQL采用SQL Client 提交方式，相比Flink1.12的优化参数，Flink 1.15需要在SQL脚本使用SET 'key'='vaule'；进行配置。详细语法请参考SQL Client Configuration。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
时间和日期类型 - 数据湖探索 DLI

时间和日期类型限制时间和日期类型目前精确到毫秒。表1 时间和日期类型名称描述存储空间 DATE 日期和时间。仅支持ISO 8601格式：'2020-01-01' 32位 TIME 不带时区的时间（时、分、秒、毫秒）例如：TIME '01:02:03.456' 64位

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
区域和可用区 - 数据湖探索 DLI

区域和可用区什么是区域、可用区？区域和可用区用于描述数据中心的位置，您可以在特定的区域、可用区创建资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Re

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类

总条数： 842

上一页
1
2
3
4
5
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Delta清理和优化 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

file - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

时间和日期类型 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线