搜索_华为云

成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

初步认识华为云数据湖探索，了解数据湖探索的基本功能、应用场景、基本概念和使用限制，有助于您更准确地匹配实际业务。产品介绍什么是DLI 应用场景使用限制与其他云服务的关系 03 入门购买DLI队列后，您可以运行SQL作业和Spark作业，开启您的数据湖探索使用之旅。使用前须知准备工作

 帮助中心 > 数据湖探索 DLI > 成长地图
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

MSCK REPAIR TABLE table_name; 执行完上述命令后，再执行对应OBS分区表的数据查询即可。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
执行作业的用户数据库和表权限不足导致作业运行失败 - 数据湖探索 DLI

执行作业的用户数据库和表权限不足导致作业运行失败问题现象 Spark作业运行报数据库权限不足，报错信息如下： org.apache.spark.sql.AnalysisException: org.apache.hadoop.hive.ql.metadata.HiveException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

dynamicPartitionOverwrite.enabled”默认值为“false”，在不配置时它会覆盖整张表的数据。详细说明请参考插入数据。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

Spark UI支持绘制火焰图。优化SQL作业NOT IN语句查询性能 NOT IN语句查询性能提升。优化Multi-INSERT语句查询性能 Multi-INSERT语句查询性能提升。切换至新版本对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

Spark UI支持绘制火焰图。优化SQL作业NOT IN语句查询性能 NOT IN语句查询性能提升。优化Multi-INSERT语句查询性能 Multi-INSERT语句查询性能提升。切换至新版本对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

行完成前修改了表名，会和作业的元数据更新过程冲突，从而影响对数据大小的判断。为了避免这种情况，建议在SQL作业执行完成后，等待5分钟后再修改表名。确保系统有足够的时间更新表的元数据，避免因修改表名而导致的数据大小统计不准确的问题。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

因此，该问题为验证方式不正确造成。参考信息插入数据的SQL语法，请参考《数据湖探索Spark SQL语法参考》。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？问题描述 Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为不一致根因分析该问题的根因是数据库设置的时区不合理，通常该问题出现时Flink读取的时间和RDS数据库的时间会相差13小时。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

create_date>'2221-12-01 00:00:00'； TIMESTAMP类型详细可参考TIMESTAMP数据类型。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

enabled”，值设置为“false”。图1 参数设置上述步骤参数设置完成后，则可以进行全表查询，不用查询表的时候要包含分区字段。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Spark 3.1.1版本说明 - 数据湖探索 DLI

【SPARK-32302】: 部分谓词下推优化。【SPARK-30648】：支持JSON datasource表谓词下推。【SPARK-32346】：支持avro datasource表谓词下推。【SPARK-32461】：shuffle hash join优化。【SPARK-32272】：添加SQL标准命令SET

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
提交SQL作业（废弃） - 数据湖探索 DLI

作业包含以下类型：DDL、DCL、IMPORT、EXPORT、QUERY和INSERT。其中，IMPORT和EXPORT分别与导入数据（废弃）和与导出数据（废弃）的功能一致，区别仅在于实现方式不同。另外，用户可使用其他API来对作业进行查询和管理。具体操作有：查询作业状态查询作业详细信息查询作业结果-方式一（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

"obs://dli-test-001/test.csv"); test.csv文件内容如下： Jordon,88,"aa bb" 因为最后一个字段的aa和bb之间存在回车换行。创建OBS外表后，查询test06表数据内容显示如下： name id classno Jordon 88 aa bb"

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

口表值函数的操作。比如窗口聚合，窗口TopN和窗口关联。窗口Top-N的语法和普通的Top-N相同。除此之外，窗口去重需要 PARTITION BY 子句包含表的 window_start 和 window_end 列。否则优化器无法翻译。 Flink 使用 ROW_NUMBER()

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
Spark 2.4.5版本说明 - 数据湖探索 DLI

支持动态加载UDF（公测）无需重启队列UDF即可生效。 Spark UI支持火焰图 Spark UI支持绘制火焰图。优化SQL作业NOT IN语句查询性能 NOT IN语句查询性能提升。优化Multi-INSERT语句查询性能 Multi-INSERT语句查询性能提升。父主题：版本支持公告

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

DLI+HetuEngine能够快速处理大规模数据集的查询请求，迅速和高效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应： HetuEngine通过自动优化资源与负载的配比，能够对TB级数据实现秒级响应，极大提升了数据查询的效率。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
Upsert Kafka结果表 - 数据湖探索 DLI

(none) String 用于对Kafka消息中key部分序列化和反序列化的格式。key字段由PRIMARY KEY语法指定。支持的格式如下： csv json avro 请参考Format页面以获取更多详细信息和格式参数。 key.fields-prefix 否 (none) String

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hudi表分区设计规范 - 数据湖探索 DLI

建议使用。建议事实表采用日期分区表，维度表采用非分区或者大颗粒度的日期分区是否采用分区表要根据表的总数据量、增量和使用方式来决定。从表的使用属性看事实表和维度表具有的特点：事实表：数据总量大，增量大，数据读取多以日期做切分，读取一定时间段的数据。维度表：总量相对小，增量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
最佳实践内容概览 - 数据湖探索 DLI

以DLI实际消费数据为样例，介绍使用DLI进行账单分析和成本优化的措施。使用DLI分析电商实时业务数据使用DLI Flink完成电商业务实时数据的分析处理。配置DBeaver连接DLI进行数据查询和分析介绍DBeaver连接DLI并提交SQL查询的操作步骤。配置DBT连接DLI进行数据调度和分析介绍使用DBT提交DLI作业的操作步骤。

帮助中心 > 数据湖探索 DLI > 最佳实践

总条数： 825

上一页
1
...
6
7
8
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

成长地图 - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

执行作业的用户数据库和表权限不足导致作业运行失败 - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

最佳实践内容概览 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线