搜索_华为云

入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

Jar读写DIS开发指南介绍Flink Jar作业读写DIS数据的操作方法。 Spark Jar作业开发使用Spark Jar作业读取和查询OBS数据介绍从编写Spark程序代码读取和查询OBS数据、编译打包到提交Spark Jar作业的开发样例。

帮助中心 > 数据湖探索 DLI > 快速入门
典型场景DLI委托权限配置示例 - 数据湖探索 DLI

本操作介绍获取Flink作业委托临时凭证的操作方法。 Spark作业场景 Spark Jar 使用DEW获取访问凭证读写OBS 访问OBS的AKSK为例介绍Spark Jar使用DEW获取访问凭证读写OBS的操作指导。用户获取Spark作业委托临时凭证本操作介绍获取Spark Jar作业委托临时凭证的操作方法。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
Hudi Compaction操作说明 - 数据湖探索 DLI

compaction.delta_commits=5 // 默认值为5，根据业务场景指定推荐方案 Spark/Flink流任务仅执行Schedule，然后另起一个Spark SQL任务定时仅执行Run。 Spark批任务可以直接同时执行Schedule + Run。为了保证入湖的最高效率，推荐

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
使用客户端工具连接DLI - 数据湖探索 DLI

使用客户端工具连接DLI 使用JDBC提交SQL作业使用Spark-submit提交Spark Jar作业使用Livy提交Spark Jar作业

 帮助中心 > 数据湖探索 DLI > 开发指南
创建DLI自定义委托权限 - 数据湖探索 DLI

OpenSource SQL作业指定委托 Spark作业指定委托登录DLI管理控制台，选择“作业管理 > Spark作业”。选择待编辑的Spark作业，单击操作列的“编辑”。在作业配置区域配置委托信息：确保所选的Spark版本为3.3.1。在“Spark参数（--conf）”区域配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

在SQL编辑器界面，单击“设置”，在“配置项”尝试添加以下几个Spark参数进行解决。参数项如下，冒号前是配置项，冒号后是配置项的值。 spark.sql.enableToString:false spark.sql.adaptive.join.enabled:true spark.sql.adaptive.enabled:true

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
DLI对接LakeFormation - 数据湖探索 DLI

在DLI暂不支持LakeFormation的路径授权。 DLI Spark Jar：本节介绍在DLI管理控制台提交Spark Jar作业时使用LakeFormation元数据的配置操作。 Spark Jar 示例 SparkSession spark = SparkSession.builder()

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

面基本功能介绍、快捷键以及使用技巧等说明。 Spark SQL作业管理提供SQL作业管理界面功能介绍。 Spark SQL模板管理 DLI支持定制模板或将正在使用的SQL语句保存为模板，便捷快速的执行SQL操作。开发指导 Spark SQL语法参考提供SQL数据库、表、分区

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
SQL作业运行慢如何定位 - 数据湖探索 DLI

带有driver的归档日志文件夹名示例图3 container_xxx_000001归档日志文件夹示例 Spark Jar作业： Spark Jar作业的归档日志文件夹以“batch”开头。图4 Spark Jar作业归档日志文件夹名示例进入归档日志文件目录，在归档日志文件目录下，下载“gc

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

Documentation 2020年3月序号功能名称功能描述阶段相关文档 1 支持Spark程序访问DLI表 DLI支持通过Spark作业访问DLI表。商用使用Spark作业访问DLI表 2 支持计算队列手动扩缩容 DLI支持手动对队列进行扩缩容。商用手动扩容/缩容

 帮助中心 > 数据湖探索 DLI > 最新动态
DLI产品咨询类 - 数据湖探索 DLI

DLI产品咨询类 DLI Flink与MRS Flink有什么区别？ DLI中的Spark组件与MRS中的Spark组件有什么区别？怎样升级DLI作业的引擎版本 DLI的数据可存储在哪些地方 DLI是否支持导入其他租户共享OBS桶的数据？区域和可用区全局变量的使用中，一个子

 帮助中心 > 数据湖探索 DLI > 常见问题
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

识。设置spark.sql.autoBroadcastJoinThreshold=-1，具体操作如下：登录DLI管理控制台，单击“作业管理 > SQL作业”，在对应报错作业的“操作”列，单击“编辑”进入到SQL编辑器页面。单击“设置”，在参数设置中选择“spark.sql.

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
SQL作业使用咨询 - 数据湖探索 DLI

timeout（单位是秒）参数配置超时时间。 DLI支撑本地测试Spark作业吗? DLI暂不支持本地测试Spark作业，您可以安装DLI Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark Jar作业。 DLI 表(OBS表 / DLI 表

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

重新执行：重新执行该作业。 SparkUI：单击后，将跳转至Spark任务运行情况界面。说明：新建队列，运行作业时会重新拉集群，大概需要10分钟左右才能拉好集群，在集群创建好之前单击SparkUI会导致缓存空的projectID，从而导致无法查看SparkUI。建议使用专属队列，

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
创建并提交SQL作业 - 数据湖探索 DLI

设置作业运行超时时间，超时取消。单位：秒。跳转至SparkUI查看SQL语句执行进程 SQL编辑器页面提供了跳转至SparkUI查看SQL语句执行进程的功能。目前DLI配置SparkUI只展示最新的100条作业信息。 default队列下运行的作业或者该作业为同步作业时不支持跳转至SparkUI查看SQL语句执行进程。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Hudi表索引设计规范 - 数据湖探索 DLI

用Flink状态索引，Flink写入后，不支持Spark继续写入。 Flink在写Hudi的MOR表只会生成log文件，后续通过compaction操作，将log文件转为parquet文件。Spark在更新Hudi表时严重依赖parquet文件是否存在，如果当前Hudi表写的是log文件，采用Spark写入就会导致重复数据的产生。在批量初始化阶段

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全，涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身，也包括运维运营安全，以及更广义的安全合规遵从。租户：负责

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
DLI中使用Hudi开发作业 - 数据湖探索 DLI

DLI中使用Hudi开发作业在DLI使用Hudi提交Spark SQL作业在DLI使用Hudi提交Spark Jar作业在DLI使用Hudi提交Flink SQL作业使用HetuEngine on Hudi

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
DLI Delta表概述 - 数据湖探索 DLI

事务和可缩放的元数据。 Delta Lake与Apache Spark API完全兼容，并且其设计能够与结构化流式处理紧密集成，可以轻松地将单个数据副本用于批处理和流式处理操作，并提供大规模增量处理。 DLI中Delta的使用限制仅Spark 3.3.1（3.0.0）及以上版本支持Delta。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI SQL和DLI Spark作业。 DLI支持的SDK分为SDK V3和DLI服务自行开发的SDK。（推荐）DLI SDK V3：是根据定义API的YAML文件统

 帮助中心 > 数据湖探索 DLI > SDK参考

总条数： 654

上一页
1
...
27
28
29
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

入门实践 - 数据湖探索 DLI

典型场景DLI委托权限配置示例 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

使用客户端工具连接DLI - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

DLI产品咨询类 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

DLI中使用Hudi开发作业 - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线