搜索_华为云

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

支持的数据类型范围创建分区表时分区字段差异支持的分区数 DataSource语法支持ORC，PARQUET，JSON，CSV，AVRO类型创建分区表时，分区字段在表名和PARTITIONED BY后都需要指定。具体可以参考DataSource语法创建单分区OBS表。单表分区数最多允许7000个。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
设置多版本备份数据保留周期 - 数据湖探索 DLI

属性。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 days 多版本中备份数据保留的日期。默认为7天，建议设置在1到7天范围内。注意事项 DLI数据多

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
创建DWS维表 - 数据湖探索 DLI
创建DWS维表 - 数据湖探索 DLI

read.partition.column 否用于对输入进行分区的列名与connector.read.partition.lower-bound、connector.read.partition.upper-bound、 connector.read.partition.num必须同时存在或者同时不存在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

放入TM任务槽的内存中。建议为streaming-source.monitor-interval（最新分区作为临时表）或 lookup.join.cache.ttl（所有分区作为临时表）设置一个相对较大的值。否则，作业容易出现性能问题，避免表更新和重新加载过于频繁。缓存刷新需

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

最后一个分区的最大值。与scan.partition.column、scan.partition.lower-bound、scan.partition.num必须同时存在或者同时不存在 scan.partition.num 否分区的个数。与scan.partition.column、scan

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
ALTER SCHEMA - 数据湖探索 DLI
ALTER SCHEMA - 数据湖探索 DLI

ALTER (DATABASE|SCHEMA) schema_name SET LOCATION obs_location ALTER (DATABASE|SCHEMA) database_name SET OWNER USER username ALTER (DATABASE|SCHEMA)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
查看多版本备份数据 - 数据湖探索 DLI

TABLE：查看备份数据。 PARTITION：指定分区列。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 column 分区列名。 value 分区列名对应的值。注意事项

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

lue为空的Kafka消息写入（表示对应 key 的消息被删除）。Flink将根据主键列的值对数据进行分区，从而保证主键上的消息有序，因此同一主键上的更新/删除消息将落在同一分区中。表1 支持类别类别详情支持表类型源表、结果表前提条件该场景作业需要运行在DLI的独享

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

创建DLI队列时队列类型需要选择为“SQL队列”。已创建云数据库RDS的MySQL的数据库实例。具体创建RDS集群的操作可以参考创建RDS MySQL数据库实例。本示例RDS数据库引擎：MySQL 本示例RDS MySQL数据库版本：5.7。已创建CDM迁移集群。创建CDM集群的操作可以参考创建CDM集群。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

save(basePath) 设置分区多级分区配置项说明 hoodie.datasource.write.partitionpath.field 配置为多个业务字段，用逗号分隔。 hoodie.datasource.hive_sync.partition_fields 和hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

rownum = 1 语法说明 ROW_NUMBER(): 从第一行开始，依次为每一行分配一个唯一且连续的号码。 PARTITION BY col1[, col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
在DLI控制台配置表权限 - 数据湖探索 DLI

删除分区：删除分区表中的任意分区。设置分区的路径：将分区表中的某个分区路径设置为用户指定的OBS路径。重命名表分区：对分区表中的分区重新命名。恢复表分区：从文件系统中导出分区信息保存到元数据中。显示所有分区：显示分区表中的所有分区。只适用于“用户授权”的权限包括：显示表：显示当前表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

String Flink partition 到 Kafka partition 的分区映射关系，可选值有： default：使用 Kafka 默认的分区器对消息进行分区。 fixed：每个 Flink partition 最终对应最多一个 Kafka partition。 round-robin：Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Upsert Kafka结果表 - 数据湖探索 DLI

lue为空的Kafka消息写入（表示对应 key 的消息被删除）。Flink将根据主键列的值对数据进行分区，从而保证主键上的消息有序，因此同一主键上的更新/删除消息将落在同一分区中。前提条件确保已创建Kafka集群。该场景作业需要运行在DLI的独享队列上，因此要与Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

rownum = 1 语法说明 ROW_NUMBER(): 从第一行开始，依次为每一行分配一个唯一且连续的号码。 PARTITION BY col1[, col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
配置SQL防御规则 - 数据湖探索 DLI

对单个表操作（select，delete，update，alter）涉及的分区数超限制。 dynamic spark 提示拦截取值范围：1-500000 默认值：5000 是 select * from 分区表 running_0002 Memory used(MB) SQL的占用内存峰值超绝对值限制。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
CREATE TABLE AS SELECT - 数据湖探索 DLI

参数描述表1 CREATE TABLE As SELECT参数描述参数描述 database_name Database名称，由字母、数字和下划线（_）组成。 table_name Database中的表名，由字母、数字和下划线（_）组成。 using 参数hudi，定义和创建Hudi

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

无 string 从Flink分区到Kafka分区的映射模式。映射模式的取值如下： fixed（默认值）：每个Flink分区对应至多一个Kafka分区。 round-robin：Flink分区中的数据将被轮流分配至Kafka的各个分区。自定义分区映射模式：如果fixed和rou

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建表时指定表的生命周期 - 数据湖探索 DLI

非分区表如果表是非分区表，根据每张表的最后修改时间，经过生命周期时间后判断是否要回收此表。分区表如果是分区表，则根据各分区的最后一次表数据被修改的时间（LAST_ACCESS_TIME）判断该分区是否该被回收。分区表的最后一个分区被回收后，该表不会被删除。分区表不支持

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

[EXTENDED|FORMATTED] [database_name.]table_name|DELTA.`obs://bucket_name/tbl_path`; 显示表详细信息： DESCRIBE DETAIL [database_name.]table_name|DELTA

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明

总条数： 1293

上一页
1
...
6
7
8
...
65
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

创建DWS维表 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

ALTER SCHEMA - 数据湖探索 DLI

查看多版本备份数据 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

在DLI控制台配置表权限 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

DESCRIBE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线