搜索_华为云

Spark SQL语法概览 - 数据湖探索 DLI

数据多版本相关语法创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

output_format_classname partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression row_format

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

); 参数说明表1 参数说明参数是否必选说明 connector 是固定为print。 print-identifier 否配置一个标识符作为输出数据的前缀。 standard-error 否该值只能为true或false，默认为false。若为true，则表示

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
更新Flink Jar作业 - 数据湖探索 DLI

用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。默认值为“1”。 log_enabled 否 Boolean 是否开启作业日志。开启：true 关闭：false 默认：false obs_bucket

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
userDefined结果表 - 数据湖探索 DLI

{} @Override public void close() throws Exception {} } 依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
（推荐）DLI SDK V3 - 数据湖探索 DLI

K，列举了最新版本SDK的获取地址。 SDK列表表1提供了DLI云服务支持的SDK列表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。表1 SDK列表编程语言 Github地址参考文档视频指导 Java huaweicloud-sdk-java-v3

帮助中心 > 数据湖探索 DLI > SDK参考
更新表分区信息（只支持OBS表） - 数据湖探索 DLI

SERDEPROPERTIES：Serde属性。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path OBS存储路径。注意事项该命令的主要应用场景是针对分区表，如当手动在OBS上面添加分区目录时，再通过上

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

DLI Flink MRS Flink 特色能力产品模式全托管（无需人力运维集群）半托管（需要人力运维集群）弹性扩缩容支持集群容器化部署。用户可以根据业务负载进行弹性扩缩容，能够基于作业的负载动态调整作业使用资源大小。支持基于作业优先级动态调整作业的使用资源。仅支持YARN集群。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

16:06:06,200.00,180.00,2021-03-24 16:10:06,0001,Alice,330106 读取sink表中配置的obs路径中的orc文件，其数据结果如下 202103251202020001, miniAppShop, 2021-03-25 12:02:02

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
新建Flink Jar作业 - 数据湖探索 DLI

用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。 log_enabled 否 Boolean 是否开启作业日志。开启：true 关闭：false 默认：false obs_bucket

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

数据的具体格式通过调用ImportJob对象的setCsvFormatInfo接口进行设置。在提交导入作业前，可选择设置导入数据的分区并配置是否是overwrite写入，分区信息可以调用ImportJob对象的setPartitionSpec接口设置，如：importJob.setPartitionSpec(new

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

单引号（''）包围起来。 partition_specs 分区信息，key=value形式，key为分区字段，value为分区值。若分区字段为多个字段，可以不包含所有的字段，会删除匹配上的所有分区。“partition_specs”中的参数默认带有“( )”，例如：PARTITION

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
CREATE TABLE语句 - 数据湖探索 DLI

则新的 watermark 不会被发出。 Watermark 根据 pipeline.auto-watermark-interval 中所配置的间隔发出。如果 watermark 的间隔是 0ms ，那么每条记录都会产生一个 watermark，且 watermark 会在不为空并大于上一个发出的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
使用DLI分析电商BI报表 - 数据湖探索 DLI

将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。下载OBS Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录

 帮助中心 > 数据湖探索 DLI > 最佳实践
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

16:06:06,200.00,180.00,2021-03-24 16:10:06,0001,Alice,330106 读取sink表中配置的obs路径中的parquet文件，其数据结果如下 202103251202020001, miniAppShop, 2021-03-25

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

默认参数数据类型说明 connector 是无 String 固定为：print。 print-identifier 否无 String 配置一个标识符作为输出数据的前缀。 standard-error 否 false Boolean 该值只能为true或false，默认为false。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用Hive语法创建OBS表 - 数据湖探索 DLI

依据的OBS分区表。在TBLPROPERTIES中配置dli.multi.version.enable、comment、orc.compress和auto.purge。 dli.multi.version.enable：本例配置为true，即代表开启DLI数据多版本功能，用于表数据的备份与恢复。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

schema-include 否 false Boolean 设置 Debezium Kafka Connect 时，用户可以启用 Kafka 配置 'value.converter.schemas.enable' 以在消息中包含 schema。此选项表明 Debezium JSON 消息是否包含

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

量和分组持续的时间，持续时间较短的 group 窗口不会产生状态过大的问题。可以提供一个合适的状态 time-to-live (TTL) 配置来防止状态过大。注意：这可能会影响查询结果的正确性。更多介绍和使用请参考开源社区文档：分组聚合。 DISTINCT 聚合 DISTINCT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML

总条数： 587

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL语法概览 - 数据湖探索 DLI

标示符 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

更新表分区信息（只支持OBS表） - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线