搜索_华为云

Spark 3.3.1版本说明 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

如果在DLI的管理控制台看到select 1，代表初始化成功。 kyuubi.frontend.protocols 用于指定Kyuubi服务支持的前端协议。Kyuubi支持多种前端协议，允许用户通过不同的接口与Kyuubi进行交互。是 mysql thrift_binary kyuubi.engine

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

如果在DLI的管理控制台看到select 1，代表初始化成功。 kyuubi.frontend.protocols 用于指定Kyuubi服务支持的前端协议。Kyuubi支持多种前端协议，允许用户通过不同的接口与Kyuubi进行交互。是 mysql thrift_binary kyuubi.engine

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

如果在DLI的管理控制台看到select 1，代表初始化成功。 kyuubi.frontend.protocols 用于指定Kyuubi服务支持的前端协议。Kyuubi支持多种前端协议，允许用户通过不同的接口与Kyuubi进行交互。是 mysql thrift_binary kyuubi.engine

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

如果在DLI的管理控制台看到select 1，代表初始化成功。 kyuubi.frontend.protocols 用于指定Kyuubi服务支持的前端协议。Kyuubi支持多种前端协议，允许用户通过不同的接口与Kyuubi进行交互。是 mysql thrift_binary kyuubi.engine

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

如果在DLI的管理控制台看到select 1，代表初始化成功。 kyuubi.frontend.protocols 用于指定Kyuubi服务支持的前端协议。Kyuubi支持多种前端协议，允许用户通过不同的接口与Kyuubi进行交互。是 mysql thrift_binary kyuubi.engine

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

本节操作介绍在DataArts Studio开发DLI SQL作业的操作步骤。开发流程图1 在DataArts Studio开发DLI SQL作业的流程图环境准备：准备执行作业所需的DLI资源和DataArts Studio资源。请参考环境准备。创建数据库和表：提交SQL脚本创建数据库和表。请参考步骤1：创建数据库和表。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
FileSystem结果表 - 数据湖探索 DLI

下个checkpoint产生的数据。示例一使用datagen随机生成数据写入obs的bucketName桶下的fileName目录中。文件生成时间与checkpoint无关，达到30min或128MB时，生成新文件。 create table orders( name string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
对象存储OBS结果表 - 数据湖探索 DLI

下个checkpoint产生的数据。示例1 使用datagen随机生成数据写入obs的bucketName桶下的fileName目录中。文件生成时间与checkpoint有关，达到30min或128MB时，生成新文件。 create table orders( name string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

pile”对代码进行编译。编译成功后，双击“package”对代码进行打包。图9 编译打包打包成功后，生成的Jar包会放到target目录下，以备后用。本示例将会生成到：“D:\DLITest\SparkJarMetadata\target”下名为“SparkJarMetadata-1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Spark 2.4.5版本说明 - 数据湖探索 DLI

更多版本新特性请参考Release Notes - Spark 2.4.5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
清理多版本数据 - 数据湖探索 DLI

创建OBS表。该命令不会删除当前版本数据。示例删除dliTable表在2021-09-25 23:59:59之前生成的多版本数据（多版本生成时会自带一个生成时间时的时间戳）。 clear history for table dliTable older_than '2021-09-25

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

插入语句后加入“DISTRIBUTE BY number”。例如，在插入语句后添加“DISTRIBUTE BY 1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

from testcsvdata2source; 图3 查询结果在OBS桶的“obs://dli-test-021/data”目录下刷新后查询，生成了csv数据文件，文件内容为insert插入的数据内容。图4 查询结果指定的OBS数据目录包含数据文件。在OBS桶“dli-test

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

timestamp=>'[timestamp]'); 参数描述表1 参数描述参数描述是否必填 op 生成compaction计划（op指定为“schedule”），或者执行已经生成的compaction计划（op指定为“run”）是 table 需要查询表的表名，支持database

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

'datagen', 'rows-per-second' = '1', --每秒生成一条数据 'fields.name.kind' = 'random', --为字段user_id指定random生成器 'fields.name.length' = '7', --限制user_id长度为7

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

启“恢复保存点”，作业将从选择的savepoint文件中恢复消费位点及状态。同时，由于Flink Checkpoint和Savepoint生成机制及格式一致，因而，也可以通过Flink作业列表“操作”列中的“更多”>“导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

cdc-events-duplicate设置为true，并在源表上定义PRIMARY KEY。Framework将生成一个额外的有状态操作符，并使用主键对变更事件进行去重，并生成一个规范化的changelog流。参数说明表1 参数说明参数是否必选默认值类型说明 format

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format

总条数： 191

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 3.3.1版本说明 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线