搜索_华为云

BI工具连接DLI方案概述 - 数据湖探索 DLI

BI工具连接DLI方案概述 BI工具是数据分析的强大助手，提供数据可视化、报表生成和仪表板创建等功能。 DLI服务通过对数据的融合分析处理，可以为BI工具提供标准的、有效的高质量数据，供给后续的数据统计分析使用。通过连接到DLI，BI工具可以更加灵活的使用DLI访问和分析数据，帮助企业快速做出基于数据的决策。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

需要创建一个OBS桶将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。 OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的

 帮助中心 > 数据湖探索 DLI > 最佳实践
队列相关API（废弃） - 数据湖探索 DLI

队列相关API（废弃）修改队列网段（废弃）创建队列定时扩缩容计划（废弃）查看队列定时扩缩容计划（废弃）批量删除队列定时扩缩容计划（废弃）单个删除队列定时扩缩容计划（废弃）修改队列定时扩缩容计划（废弃）父主题：历史API

帮助中心 > 数据湖探索 DLI > API参考 > 历史API
使用BI工具连接DLI分析数据 - 数据湖探索 DLI

使用BI工具连接DLI分析数据 BI工具连接DLI方案概述配置DBeaver连接DLI进行数据查询和分析配置DBT连接DLI进行数据调度和分析配置YongHong BI连接DLI进行数据查询和分析配置PowerBI通过Kyuubi连接DLI进行数据查询和分析配置Fine

帮助中心 > 数据湖探索 DLI > 最佳实践
使用客户端工具连接DLI - 数据湖探索 DLI

使用客户端工具连接DLI 使用JDBC提交SQL作业使用Spark-submit提交Spark Jar作业使用Livy提交Spark Jar作业

 帮助中心 > 数据湖探索 DLI > 开发指南
DIS结果表 - 数据湖探索 DLI
DIS结果表 - 数据湖探索 DLI

建数据流管道，主要解决云服务外的数据实时传输到云服务内的问题。数据接入服务每小时可从数十万种数据源（如IoT数据采集、日志和定位追踪事件、网站点击流、社交媒体源等）中连续捕获、传送和存储数TB数据。DIS的更多信息，请参见《数据接入服务用户指南》。语法格式 1 2 3 4

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hudi表模型设计规范 - 数据湖探索 DLI

计算场景下采用MOR表模型。关于MOR表在读写性能的对比关系如下：对比维度 MOR表 COW表流式写高低流式读高低批量写高低批量读低高实时入湖，表模型采用MOR表。实时入湖一般的性能要求都在分钟内或者分钟级，结合Hudi两种表模型的对比，因此在实时入湖场景中需要选择MOR表模型。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

应用场景 DLI服务适用于海量日志分析、异构数据源联邦分析、大数据ETL处理。海量日志分析游戏运营数据分析游戏公司不同部门日常通过游戏数据分析平台，分析每日新增日志获取所需指标，通过数据来辅助决策。例如：运营部门通过平台获取新增玩家、活跃玩家、留存率、流失率、付费率等，了解

 帮助中心 > 数据湖探索 DLI > 产品介绍
Spark作业运维类 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] Spark作业运行大批量数据时上报作业运行超时异常错误使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常执行作业的用户数据库和表权限不足导致作业运行失败

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
Elasticsearch结果表 - 数据湖探索 DLI

max-actions 否批量写入时的每次最大写入记录数 connector.bulk-flush.max-size 否批量写入时的最大数据量，当前只支持MB，请带上单位 mb connector.bulk-flush.interval 否批量写入时的刷新的时间间隔，单位为milliseconds，无需带上单位

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hudi数据表Clean规范 - 数据湖探索 DLI

retained设置的阈值。如果是Flink写hudi，则至少提交的checkpoint要超过这个阈值；如果是批写Hudi，则批写次数要超过这个阈值。建议 MOR表下游采用批量读模式，采用clean的版本数为compaction版本数+1。 MOR表一定要保证Compaction Plan能够被成功执行，Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

stopFlinkJob(body); System.out.println(result); } 批量删除作业 DLI提供批量删除Flink作业的接口。您可以使用该接口批量删除任何状态的Flink作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

建数据流管道，主要解决云服务外的数据实时传输到云服务内的问题。数据接入服务每小时可从数十万种数据源（如IoT数据采集、日志和定位追踪事件、网站点击流、社交媒体源等）中连续捕获、传送和存储数TB数据。DIS的更多信息，请参见《数据接入服务用户指南》。语法格式 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
使用JDBC提交SQL作业 - 数据湖探索 DLI

使用JDBC提交SQL作业本文介绍通过JDBC连接DLI并提交SQL作业。下载并安装JDBC驱动包使用JDBC连接DLI并提交SQL作业 DLI JDBC Driver支持的API列表父主题：使用客户端工具连接DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

图2 续费管理为包年/包月资源开通自动续费。单个资源开通自动续费：选择需要开通自动续费的资源，单击操作列“更多 > 开通自动续费”。批量资源开通自动续费：选择需要开通自动续费的资源，单击列表左上角的“更多 > 开通自动续费”。选择续费时长，并根据需要设置自动续费次数，单击“开通”。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 DLI Livy简介 DLI Livy是基于开源的Apache Livy用于提交Spark作业到DLI的客户端工具。准备工作创建DLI队列。在“队列类型”中选择“通用队列”，即Spark作业的计算资源。具体请参考创建队列。准备一个li

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
Hudi表索引设计规范 - 数据湖探索 DLI

表时严重依赖parquet文件是否存在，如果当前Hudi表写的是log文件，采用Spark写入就会导致重复数据的产生。在批量初始化阶段，先采用Spark批量写入Hudi表，再用Flink基于Flink状态索引写入不会有问题，原因是Flink冷启动的时候会遍历所有的数据文件生成状态索引。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Flink作业常用操作 - 数据湖探索 DLI

启动作业，有以下两种方式：启动单个作业选择一个作业，在对应的“操作”列中，单击“启动”。也可以在作业列表中，勾选一个作业，单击作业列表左上方的“启动”。批量启动作业勾选多个作业，单击作业列表左上方的“启动”，可以启动多个作业。单击“启动”后，跳转至“作业配置清单”页面。在“作业配置清单”

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
队列属性设置 - 数据湖探索 DLI

仅Spark引擎的SQL队列支持配置队列属性。仅在队列创建完成后支持设置队列属性。当前仅支持设置Spark driver相关队列属性。不支持批量设置队列属性。弹性资源池中的队列，当队列的最小CUs小于16CUs时，在队列属性中设置的“最大spark driver实例数”和“最大预拉起spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 DLI Spark-submit简介 DLI Spark-submit是一个用于提交Spark作业到DLI服务端的命令行工具，该工具提供与开源Spark兼容的命令行。准备工作授权。 DLI使用统一身份认证服务（Identity

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI

总条数： 124

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

BI工具连接DLI方案概述 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

队列相关API（废弃） - 数据湖探索 DLI

使用BI工具连接DLI分析数据 - 数据湖探索 DLI

使用客户端工具连接DLI - 数据湖探索 DLI

DIS结果表 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

Spark作业运维类 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

使用JDBC提交SQL作业 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

队列属性设置 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线