搜索_华为云

Spark SQL语法参考（即将下线） - 数据湖探索 DLI

Spark SQL语法参考（即将下线）批作业SQL常用配置项说明批作业SQL语法概览 Spark开源命令支持说明数据库创建OBS表创建DLI表删除表查看表修改表分区表相关导入数据插入数据清空数据导出查询结果多版本备份恢复数据表生命周期管理跨源连接HBase表

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线）
数据类型 - 数据湖探索 DLI
数据类型 - 数据湖探索 DLI

FROM car_infos; 复杂类型嵌套 Json格式增强以Source为例进行说明，Sink的使用方法相同。支持配置Json_schema 配置了json_schema后，可以不声明DDL中的字段，自动从json_schema中生成。使用示例如下： CREATE SOURCE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）
Spark2.4.x与Spark3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Spark2.4.x：配置名为spark.launcher.childConectionTimeout Spark3.3.x：配置名修改为spark.launcher.childConnectionTimeout 升级引擎版本后是否对作业有影响：有影响，配置参数名称变化。 Spark3

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark2.4.x与Spark3.3.x版本差异对比
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

登录DLI管理控制台，单击“作业管理 > SQL作业”，对应SQL作业行的操作列，单击“编辑”按钮，跳转到“SQL编辑器”。在“SQL编辑器”中，单击“设置”，参考如下图配置添加参数。图1 设置参数重新执行作业。父主题： SQL作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Hudi表索引设计规范 - 数据湖探索 DLI

文件的footer中。 Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写入；该索引写入速度最快，但是需要合理配置分桶数目；Flink、Spark均支持该索引写入。状态索引：Flink引擎独有索引，是将行记录的存储位置记录到状态后端的一种索引形式，在

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
OBS输入流 - 数据湖探索 DLI
OBS输入流 - 数据湖探索 DLI

版本号，当obs里的桶或对象有设置版本的时候需填写，否则不用配置该项。注意事项在创建Source Stream时可以指定时间模型以便在后续计算中使用，当前DLI支持Processing Time和Event Time两种时间模型，具体使用语法可以参考配置时间模型。示例从OBS的桶读取对象为input

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
OBS输入流 - 数据湖探索 DLI
OBS输入流 - 数据湖探索 DLI

版本号，当obs里的桶或对象有设置版本的时候需填写，否则不用配置该项。注意事项在创建Source Stream时可以指定时间模型以便在后续计算中使用，当前DLI支持Processing Time和Event Time两种时间模型，具体使用语法可以参考配置时间模型。示例从OBS的桶读取对象为input

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
Flink SQL作业类 - 数据湖探索 DLI

SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败 Kafka Sink配置发送失败重试机制如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？作业语义检验时提示DIS通道不存在怎么处理？

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

是否仅通过域名访问es节点，默认为false。使用经典型跨源的连接地址作为es.nodes时，该参数需要配置为true；使用css服务提供的原始内网IP地址作为es.nodes时，不需要填写该参数或者配置为false。 es.mapping.id 指定一个字段，其值作为es中Document的id。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

缓存到Slot内存中，然后通过键将流中的每条记录与表进行关联，以确定是否找到匹配项。将最新的Hive表用作时间表不需要任何额外的配置。使用以下属性配置Hive表缓存的TTL。在缓存过期后，将重新扫描Hive表以加载最新的数据。参数默认值类型说明 lookup.join.cache

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

使用hive 方言：表属性中需要添加'is_lakehouse'='true'。创建Flink OpenSource SQL作业时，在作业编辑界面配置开启checkpoint功能。语法格式、参数说明请参考Hive源表的语法格式和参数说明。父主题： Hive

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
添加Flink作业标签 - 数据湖探索 DLI

单击“标签”页签，显示当前作业的标签信息。图1 管理作业标签单击“添加/编辑标签”，弹出“添加/编辑标签”对话框。在“添加/编辑标签”对话框中配置标签参数。图2 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预先在

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用DataSource语法创建DLI表 - 数据湖探索 DLI

依据的DLI分区表。在OPTIONS中配置pmultiLevelDirEnable和compression。 multiLevelDirEnable：本例设置为true，表示查询该表时会迭代读取表路径中的所有文件和子目录文件，若不需要此项配置可以设置为false或不设置（默认为false）；

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 创建DLI表
使用DataSource语法创建DLI表 - 数据湖探索 DLI

依据的DLI分区表。在OPTIONS中配置pmultiLevelDirEnable和compression。 multiLevelDirEnable：本例设置为true，表示查询该表时会迭代读取表路径中的所有文件和子目录文件，若不需要此项配置可以设置为false或不设置（默认为false）；

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
增强型跨源连接类 - 数据湖探索 DLI

增强型跨源连接类增强型跨源连接绑定队列失败怎么办？ DLI增强型跨源连接DWS失败怎么办？创建跨源成功但测试网络连通性失败怎么办？怎样配置DLI队列与数据源的网络连通？为什么DLI增强型跨源连接要创建对等连接？ DLI创建跨源连接，绑定队列一直在创建中怎么办？新建跨源连接

 帮助中心 > 数据湖探索 DLI > 常见问题
Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

<scope> provided </scope> </dependency> 或使用exclusions标签将其排除关联。若使用到hdfs的配置文件，则需要将core-site.xml、hdfs-site.xml、yarn-site.xml 修改为mrs-core-site.xml、mrs-hdfs-site

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Spark 2.4.5版本说明 - 数据湖探索 DLI

版本主要的功能特性。更多版本新特性请参考Release Notes - Spark 2.4.5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
永洪BI创建数据集 - 数据湖探索 DLI

请参见图3。图3 选择数据源左侧“表”栏中单击右键，刷新表，将列出所有数据库及数据库下面的数据表（这是添加数据源时，“表结构模式”没有配置时的情况），请参见图4。图4 刷新数据表在左侧“SQL语句”栏中执行表查询命令”select * from table_name“，单

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析 > 永洪BI对接DLI提交Spark作业
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

中的open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表

总条数： 883

上一页
1
...
40
41
42
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL语法参考（即将下线） - 数据湖探索 DLI

数据类型 - 数据湖探索 DLI

Spark2.4.x与Spark3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

OBS输入流 - 数据湖探索 DLI

OBS输入流 - 数据湖探索 DLI

Flink SQL作业类 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

添加Flink作业标签 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

增强型跨源连接类 - 数据湖探索 DLI

Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

永洪BI创建数据集 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线