搜索_华为云

应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

数据分级存储：车企需要保留全量历史数据支撑审计类等业务，低频进行访问。温冷数据存放在低成本的对象存储服务OBS上，高频访问的热数据存放在数据引擎（CloudTable和DWS）中，降低整体存储成本。告警快速敏捷触发服务器弹性伸缩：对CPU、内存、硬盘空间和带宽无特殊要求。建议搭配以下服务使用

 帮助中心 > 数据湖探索 DLI > 产品介绍
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

查看Spark作业原始资源配置查看Spark作业实时运行资源查看Spark作业实时运行资源，即查看有多少CU正在运行。登录DLI 控制台，单击左侧“作业管理”>“Spark作业”，在作业列表中找到需要查看的Spark作业，单击“操作”列中的“SparkUI”。在SparkUI页面可查看Spark作业实时运行资源。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
区域和可用区 - 数据湖探索 DLI

目前，华为云已在全球多个地域开放云服务，您可以根据需求选择适合自己的区域和可用区。更多信息请参见华为云全球站点。如何选择区域？选择区域时，您需要考虑以下几个因素：地理位置一般情况下，建议就近选择靠近您或者您的目标用户的区域，这样可以减少网络时延，提高访问速度。不过，在基础设施、

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ - 数据湖探索 DLI

保留插入和删除表testTable数据的权限，则需要重新对该表进行权限赋予。问题根因删除表后再重建同名的表，该场景下表权限不会自动继承，需要重新对需要操作该该表的用户或项目进行赋权操作。解决方案表删除再创建后，需要重新对需要操作该表的用户或项目进行赋权操作。具体操作如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
使用DataSource语法创建OBS表 - 数据湖探索 DLI

时会迭代读取表路径中的所有文件和子目录文件，若不需要此项配置可以设置为false或不设置（默认为false）； dataDelegated：本例设置为true，表示在删除表或相关分区时，会一并清除该path路径下的所有数据，若不需要此项配置可以设置为false或不设置（默认为false）；

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Hive语法创建OBS表 - 数据湖探索 DLI

细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文件系统是一种高性能文件系统，提供毫秒级别访问时延，TB/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时会统计大小。添加数据时不会修改大小。如需查看表大小可以通过OBS查看。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
创建并提交SQL作业 - 数据湖探索 DLI

SQL作业支持Spark和HetuEngine两种引擎： Spark引擎适用于离线分析。 HetuEngine引擎适用于交互式分析。队列下拉选择需要使用的队列。如果没有可用队列，此处显示“default”队列，default队列为体验使用，建议重新创建队列。具体队列创建可以参考创建弹性资源池并添加队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

该参数可以设置保留多少字节大小的归档文件，默认值5368709120字节（5G）。 hoodie.archive.file.cleaner.days.retained 当清理策略为KEEP_ARCHIVED_FILES_BY_DAYS时，该参数可以设置保留多少天以内的归档文件，默认值30（天）。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

作业中，可以使用CREATE语句来定义Source表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不同的连接参数，并确保Flink作业能够正确地将数据路由到各个集群。例如本例中分别对es1和es2定义连接器类型以及相关的属性。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
配置DLI作业桶 - 数据湖探索 DLI

级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。使用须知请勿将该OBS桶用作其它用途，避免出现作业结果混乱等问题。 OBS桶需要由用户主账户统一设置及修改，子用户无权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

dli.user.file file 如果是对接notebook工具场景时不需要设置。 spark.dli.user.className class_name 如果是对接notebook工具场景时不需要设置。 spark.dli.user.scType sc_type 推荐使用livy原生配置。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
SHOW_COMMIT_FILES - 数据湖探索 DLI
SHOW_COMMIT_FILES - 数据湖探索 DLI

时间戳 total_records_updated 该文件中多少个record被更新 total_records_written 该文件中新插入了多少个record total_bytes_written 该文件新增多少bytes的数据 total_errors 指定的instant在更新或者插入过程中的报错

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

Spark、Apache Flink、trino生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
数据湖探索简介 - 数据湖探索 DLI

原有队列，无弹性资源池时弹性资源池扩容时长手工扩容时间长，扩容时长在分钟级别不需要手工干预，秒级动态扩容。资源利用率不同队列之间资源不能共享。例如：队列1当前还剩余10CU资源，队列2当前负载高需要扩容时，队列2不能使用队列1中的资源，只能单独对队列1进行扩容。添加到同一个

 帮助中心 > 数据湖探索 DLI > 产品介绍
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

提交Spark jar作业的场景需要手动配置由LakeFormation提供元数据服务的Hudi锁实现类，请参照 Hudi锁配置说明。登录DLI管理控制台，选择“作业管理 > Spark作业”，进入到Spark作业的界面。提交Hudi相关的Spark jar作业需要选择Spark版本为3

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
查询Spark作业日志 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
查询SQL作业日志 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

各云服务之间存在业务交互关系，一些云服务需要与其他云服务协同工作，需要您创建云服务委托，将操作权限委托给DLI服务，让DLI服务以您的身份使用其他云服务，代替您进行一些资源运维工作。例如：在DLI新建Flink作业所需的AKSK存储在数据加密服务DEW中，如需允许DLI在执行作业时访问DEW数据，需要提供IA

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi表在写入数据时会自动判断是否需要执行Clean，因为Clean的开关默认打开(hoodie.clean.automatic默认为true)。 Clean操作并不是每次写数据时都会触发，至少需要满足两个条件： Hudi表中需要有旧版本的文件。对于COW表来说，只要保证数据被更新过就一

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
查询Flink作业日志 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业

总条数： 655

上一页
1
2
3
4
5
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

应用场景 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

SHOW_COMMIT_FILES - 数据湖探索 DLI

概述 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线