搜索_华为云

Hudi数据表设计规范 - 数据湖探索 DLI

Hudi数据表设计规范 Hudi表模型设计规范 Hudi表索引设计规范 Hudi表分区设计规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Spark表数据维护规范 - 数据湖探索 DLI

tblproperties('hoodie.index.type'='xx'); 除Spark以外，其他引擎也可以修改Hudi表元数据，但是这种修改会导致整个Hudi表出现数据重复，甚至数据损坏；因此禁止修改上述属性。父主题： Spark on Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Hudi数据表管理操作规范 - 数据湖探索 DLI

Hudi数据表管理操作规范 Hudi数据表Compaction规范 Hudi数据表Clean规范 Hudi数据表Archive规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Hudi数据表Clean规范 - 数据湖探索 DLI

的话近几个小时之内的增量数据可以通过log文件读出，如果保留时长过短，下游flink作业在重启或者异常中断阻塞的情况下，上游增量数据已经Clean掉了，flink需要从parquet文件读增量数据，性能会有下降；如果保留时间过长，会导致log里面的历史数据冗余存储。具体可以按照

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

大数据ETL处理运营商大数据分析运营商数据体量在PB~EB级，其数据种类多，有结构化的基站信息数据，非结构化的消息通信数据，同时对数据的时效性有很高的要求，DLI服务提供批处理、流处理等多模引擎，打破数据孤岛进行统一的数据分析。优势大数据ETL：具备TB~EB级运营商数据治理能力，能快

 帮助中心 > 数据湖探索 DLI > 产品介绍
复杂数据类型 - 数据湖探索 DLI

复杂数据类型 Spark SQL支持复杂数据类型，如表1所示。表1 复杂数据类型数据类型描述使用格式 ARRAY 一组有序字段，使用指定的值构造ARRAY数组。可以为任意类型，要求所有字段的数据类型必须相同。 array(<value>,<value>[, ...]) 具体使用示例详见：ARRAY示例。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

了解Kafka计费说明。 RDS MySQL 数据库 RDS for MySQL提供在线云数据库服务。 RDS对您选择的数据库实例、数据库存储和备份存储（可选）收费。了解RDS计费说明。 DLV DLV适配云上云下多种数据源，提供丰富多样的可视化组件，快速定制数据大屏。使用DLV服务的费用主要

 帮助中心 > 数据湖探索 DLI > 最佳实践
查看表元数据 - 数据湖探索 DLI

查看表元数据元数据说明元数据（Metadata）是用来定义数据类型的数据。主要是描述数据自身信息，包含源、大小、格式或其它数据特征。数据库字段中，元数据用于诠释数据仓库的内容。创建表时，会定义元数据，由列名、类型、列描述三列组成。 “元数据”页面将显示目标表的列名、列类型、类型和描述。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
使用DLI分析电商BI报表 - 数据湖探索 DLI

使用DLI进行电商数据分析的操作过程主要包括以下步骤：步骤1：上传数据。将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。步骤2：分析数据。使用DLI对待分析的数据进行查询。具体样例数据及详细SQL语句可以通过数据包进行下载。数据说明为保护用户的隐私和数据安全，所有数据均已进行了采样和脱敏。

帮助中心 > 数据湖探索 DLI > 最佳实践
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

特定类型的数据，使得数据可以被有效地查询和分析。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。 · 元数据：元数据（Metadata）是用来定义数据类型的数据。主要是描述数据自身信息，包含源、大小、格式或其它数据特征。数据库字段中，元数据用于诠释数据仓库的内容。

帮助中心 > 数据湖探索 DLI > 功能总览
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

细的查询。详细的数据说明请参考数据说明。图1 方案简介流程指导使用DLI进行驾驶行为数据分析的操作过程主要包括以下步骤：步骤1：上传数据。将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。步骤2：分析数据。使用DLI对待分析的数据进行查询。示例代码

 帮助中心 > 数据湖探索 DLI > 最佳实践
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

BI。单击“数据连接 > 数据连接管理”。单击“添加数据源”创建一个新的数据源。在数据源的向导中选择数据库类型。本例选择“Hadoop Hive” 配置数据库连接信息：数据连接名称：用户自定义数据连接名称。驱动：选择2.a中的驱动。数据库名称：DLI的数据库名称。主机：安装Kyuubi主机IP地址。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

I进行数据查询和分析 Tableau是一款数据分析和可视化工具，支持通过拖放式界面连接到各种数据源，创建交互式和共享式的数据可视化，从而将数据转化为可操作的见解。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

同时根据读取的数据生成新的数据或对数据进行修改。使用Hive和Datasource（除Hudi外）表在执行数据修改类命令（例如insert into，load data）时由于数据源不支持事务性，在系统故障或队列资源重启后，可能会导致数据重复或数据不一致等问题。为了避免这种情

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

LI进行数据查询和分析 Superset是一个开源的数据探索和可视化平台，支持对数据进行快速、直观的探索，同时支持创建丰富的数据可视化和交互式仪表板。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通过

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用DLI分析账单消费数据 - 数据湖探索 DLI

步骤1：获取消费数据。获取账户的实际消费数据。步骤2：分析账户消费结构并优化。在DLI上分析账户消费结构，找出开支较大的资源或用户，并给出降底成本的优化措施。资源和成本规划表1 资源和成本规划资源资源说明成本说明 DLI 数据湖探索（DLI）作为华为云大数据分析平台，其计费项

 帮助中心 > 数据湖探索 DLI > 最佳实践
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通过将Beeline与Kyuubi对接，用户可以利用Kyuubi访问DLI进行数据查询和分析。这种集成简化了数据访问流程，提供了数据的统一管理和分析能力，使得用户能够更深入地洞察数据。本节操作介绍Beeline基于Kyu

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置SQL防御规则 - 数据湖探索 DLI

配置SQL防御规则什么是SQL防御大数据领域的SQL引擎层出不穷，在带给解决方案多样性的同时，也暴露出一定的问题，例如SQL输入语句质量良莠不齐、SQL问题难定位、大SQL语句消耗资源过多等。低质量的SQL会对数据分析平台系统带来不可预料的冲击，影响系统的性能或者平台稳定性。 DLI在Spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业

总条数： 1507

上一页
1
2
3
4
5
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表设计规范 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

Spark表数据维护规范 - 数据湖探索 DLI

Hudi数据表管理操作规范 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

查看表元数据 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线