搜索_华为云

FileSytem结果表 - 数据湖探索 DLI

FileSytem结果表功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

升级Spark引擎和修改数据表时，如新建队列时切换了计算资源类型可能会导致计费资源的费用变化。如果原队列使用的是弹性资源池类型的计算资源，那么新建队列不涉及计算资源的费用变化。如果原队列使用的是非弹性资源池的类型的计算资源，那么使用弹性资源池资源新建队列后计算资源的费用将发生变化，具体情况以计算资源的价格详情为准。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

BI连接Kyuubi：在BI工具中创建一个新的数据连接，通过JDBC连接Kyuubi。步骤1：安装并配置Kyuubi连接DLI 如需使用外网访问Kyuubi请确保弹性云服务器绑定弹性公网IP，并配置安全组入方向开启10009和3309端口。安装JDK。在安装和使用Kyuubi前，确保您的开发环境已安装JDK。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Hudi数据表Clean规范 - 数据湖探索 DLI

Plan能够被成功执行，Compaction Plan只是记录了Hudi表中哪些Log文件要和哪些Parquet文件合并，所以最重要的地方在于保证Compaction Plan在被执行的时候它需要合并的文件都存在。而Hudi表中只有Clean操作可以清理文件，所以建议Clean的触发阈值（hoodie.cleaner

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
创建并提交Spark作业 - 数据湖探索 DLI

本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。查询组内资源包：确认上传的资源包是否正确。创建批

 帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
创建并提交Flink作业 - 数据湖探索 DLI

本章节指导用户通过API创建并运行Flink自定义作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Flink自定义作业所需的资源包。查询组内资源包：确认上传的资源包是否正确。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch.size.bytes 单次batch的总数据量上限，默认为1mb。如果单条数据非常小，在bulk存储到总数据量前提前

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

DLI将作业的输出数据输出到HBase中。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。HBase支持消息数据、

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

计算费用：计算费用=单价*CU数*小时数 1个月计算费用：0.4（弹性资源池计算单价：元/时） x 256（CU数） x 24 x 30（小时数） = 73728 元/月存储费用=单价*存储数据量（GB）*小时数存储费用：0.00013889（存储单价：元/GB）x 1024（存储数据大小：GB）x 24 x 30（小时数）=

帮助中心 > 数据湖探索 DLI > 计费说明
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
导出查询结果 - 数据湖探索 DLI

o格式进行存储。语法格式 1 2 3 4 INSERT OVERWRITE DIRECTORY path USING file_format [OPTIONS(key1=value1)] select_statement; 关键字 USING：指定所存储格式。 O

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

对接RDS 对接DWS 对接CSS 常见问题了解更多常见问题、案例和解决方案通用问题怎样升级DLI作业的引擎版本？怎样排查DLI计费异常？ DLI Flink与MRS Flink有什么区别？ DLI的数据可存储在哪些地方？更多 SQL作业相关问题如何理解DLI分区表的列赋权？

帮助中心 > 数据湖探索 DLI > 成长地图
Spark jar 如何读取上传文件 - 数据湖探索 DLI

Spark jar 如何读取上传文件 Spark可以使用SparkFiles读取 –-file中提交上来的文件的本地路径，即：SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

setOverWrite(Boolean.TRUE)。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。导入分区数据 DLI提供导入数据的接口。您可以使用该接口将存储在OBS中的数据导入到已创建的DLI表或者OBS表指定分区中。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
DWS源表（不推荐使用） - 数据湖探索 DLI

按照如下操作查看taskmanager.out文件中的数据结果。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
SQL作业访问报错：File not Found - 数据湖探索 DLI

执行SQL作业访问报错：File not Found。可能原因可能由于文件路径错误或文件不存在导致系统无法找指定文件路径或文件。文件被占用。解决措施检查文件路径、文件名。检查文件的路径是否正确，包括目录名称和文件名。文件被占用文件被占用导致的文件报错找不到，一般是读写冲突产生的，建议查询SQ

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类

总条数： 566

上一页
1
...
8
9
10
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

FileSytem结果表 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

SQL作业访问报错：File not Found - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线