搜索_华为云

创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

进入Spark作业编辑页面，页面会提示系统将创建DLI临时数据桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志、作业结果等。如果不创建该桶，将无法查看作业日志。可以通过配置生命周期规则实现定时删除OBS桶中的对象或者定时转换对象的存储类别。桶名称为系统默认。如果不需要创建DLI临时数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

支持创建丰富的数据可视化和交互式仪表板。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通过将Superset与Kyuubi对接，用户可以利用Kyuubi访问DLI进行数据查询和分析。这种集成简化了数据

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
怎样管理在DLI上运行的作业 - 数据湖探索 DLI

怎样管理在DLI上运行的作业管理大量的DLI作业时您可以采用以下方案：作业分组：将几万个作业根据不同的类型分组，不同类型的作业通过不同的队列运行。创建IAM子用户或者创建IAM子用户，将不同类型的作业通过不同的用户执行。具体请参考《数据湖探索用户指南》。此外DLI还

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

区值“__HIVE_DEFAULT_PARTITION__”，当前Spark判断分区为空时，则会直接返回null，不返回具体的数据。解决方案登录DLI管理控制台，在“SQL编辑器”中，单击“设置”。在参数设置中，添加参数“spark.sql.forcePartitionPr

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

据可视化，从而将数据转化为可操作的见解。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通过将Tableau与Kyuubi对接，用户可以利用Kyuubi访问DLI进行数据查询和分析。这种集成简化了数据访

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

为直观的图表和仪表板，快速获得数据洞察。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通过将Fine BI与Kyuubi对接，用户可以利用Kyuubi访问DLI进行数据查询和分析。这种集成简化了数据访

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

成本说明 OBS 需要创建一个OBS桶将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。 OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定

 帮助中心 > 数据湖探索 DLI > 最佳实践
SMN结果表 - 数据湖探索 DLI
SMN结果表 - 数据湖探索 DLI

息通知服务（SMN）中。消息通知服务（Simple Message Notification，简称SMN）为DLI提供可靠的、可扩展的、海量的消息处理服务，它大大简化系统耦合，能够根据用户的需求，向订阅终端主动推送消息。可用于连接云服务、向多个协议推送消息以及集成在产生或使用通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Delta清理和优化 - 数据湖探索 DLI

delta_table0 RETAIN 168 HOURS;--单位只支持HOURS 优化Delta表为了提高查询速度，Delta Lake支持优化数据在存储中的布局，这会将许多较小的文件压缩为较大的文件。 optimize delta_table0; optimize delta_table0

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

S外表后，查询test06表数据内容显示如下： name id classno Jordon 88 aa bb" null null 解决方案创建OBS外表时，通过multiLine=true来指定列数据包含回车换行符。针对举例的建表语句，可以通过如下示例解决： CREATE TABLE

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
使用HetuEngine on Hudi - 数据湖探索 DLI

使用HetuEngine on Hudi HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine对Hudi仅支持select操

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
配置DLI作业桶 - 数据湖探索 DLI

配置DLI作业桶使用DLI服务前需配置DLI作业桶，该桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台的“全局配置 > 工程配置”页面配置DLI作业桶。操作前准备配置前，请先购买OBS桶或并行文件系统。大数据场景推

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
CREATE TABLE语句 - 数据湖探索 DLI

computed_column_expression” 语法生成的虚拟列。它由使用同一表中其他列的非查询表达式生成，并且不会在表中进行物理存储。例如，一个计算列可以使用 cost AS price * quantity 进行定义，这个表达式可以包含物理列、常量、函数或变量的任意组合，但这个表达式不能存在任何子查询。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
使用DataSource语法创建OBS表 - 数据湖探索 DLI

ource语法的CTAS创建table1_ctas。此外，本例中table1中OBS表的存储格式为orc，而table1_ctas表的存储格式可以为parquet，即CTAS创建的表存储格式可以不同于原表。在AS关键字后使用SELECT语句选择需要的数据插入到table1_ctas表中。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Hive语法创建OBS表 - 数据湖探索 DLI

是 OBS表存储格式，支持TEXTFILE, AVRO, ORC, SEQUENCEFILE, RCFILE, PARQUET table_comment 否表描述。仅支持字符串常量。 obs_path 是数据文件所在的OBS存储路径，推荐使用OBS并行文件系统存储。格式：o

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Hudi Compaction操作说明 - 数据湖探索 DLI

tion Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Hudi Clean操作说明 - 数据湖探索 DLI

Clean操作说明什么是Clean Cleaning用于清理Hudi表不再需要的老版本数据文件 (parquet文件或者log文件)，减轻存储压力，提升list操作效率。如何执行Clean 写完数据后clean Spark SQL（设置如下参数，随后执行任意写入SQL时，在满足条件时触发）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
迁移数据场景概述 - 数据湖探索 DLI

视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。图1 迁移数据至DLI 常见迁移场景与迁移方案指导表1 常见迁移场景与迁移方案指导数据类型迁移工具迁移方案 Hive CDM 典型场景示例：迁移Hive数据至DLI Kafka CDM 典型场景示例：迁移Kafka数据至DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明

总条数： 469

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Spark作业 - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

怎样管理在DLI上运行的作业 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

SMN结果表 - 数据湖探索 DLI

Delta清理和优化 - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

使用HetuEngine on Hudi - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线