搜索_华为云

在Spark SQL作业中使用UDF - 数据湖探索 DLI

等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的SQL队列。跨账号使用UDF时，除了创建UDF函数的用户，其他用户如果需要使用时，需要先进行授权才可使用对应的UDF函数。授权操作参考如下：登录DLI管理控制台，选择“

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建表（废弃） - 数据湖探索 DLI

新增表的列。列相关参数请参考表4。data_location为VIEW时可不填写。 select_statement 否 String 创建视图时依赖的查找语句。查找语句中的表需要附加所属数据库，即 “数据库.数据表”格式。data_location为VIEW时填写。 data_type 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

当data-type为set时，Flink中定义的非主键字段的数据类型必须相同。当data-type为sorted-set并且schema-syntax为fields和array时，只能读取redis的sorted set中的值，而不能读取score。当data-type为string时，只能有一个非主键字段。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
创建表时指定表的生命周期 - 数据湖探索 DLI

假设某个分区表生命周期为1天，该分区数据最后一次被修改的时间是2023年05月20日15时。如果在2023年05月20日15时之前扫描此表（不到一天），则不会回收表分区。如果2023年05月20日回收扫描时发现表分区最后一次表数据被修改的时间（LAST_ACCESS_TIME）超过生命周期指定的时间，则上述分区会被回收。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 表生命周期管理
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

当data-type为set时，Flink中定义的非主键字段的数据类型必须相同。当data-type为sorted-set并且schema-syntax为fields和array时，只能读取redis的sorted set中的值，而不能读取score。当data-type为string时，只能有一个非主键字段。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

的当前水印，如果管道中的当前操作没有可用的上游操作的公共水印时则为 NULL。函数的返回类型被推断为与提供的时间列属性匹配，但调整后的精度为 3。例如时间列属性为 TIMESTAMP_LTZ(9)，则函数将返回 TIMESTAMP_LTZ(3)。请注意，此函数可以返回 NULL，您可能必须考虑这种情况。例如，如果您想过滤掉后期数据，您可以使用：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
使用Hive语法创建OBS表 - 数据湖探索 DLI

式分析场景。注意事项创建表时会统计大小。添加数据时不会修改大小。如需查看表大小可以通过OBS查看。 CTAS建表语句不能指定表的属性。关于分区表的使用说明：创建分区表时，PARTITONED BY中指定分区列必须是不在表中的列，且需要指定数据类型。分区列支持string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Hive语法创建OBS表 - 数据湖探索 DLI

式分析场景。注意事项创建表时会统计大小。添加数据时不会修改大小。如需查看表大小可以通过OBS查看。 CTAS建表语句不能指定表的属性。关于分区表的使用说明：创建分区表时，PARTITONED BY中指定分区列必须是不在表中的列，且需要指定数据类型。分区列支持string

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 创建OBS表
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

当data-type为set时，Flink中定义的非主键字段的数据类型必须相同。当data-type为sorted-set并且schema-syntax为fields和array时，只能读取redis的sorted set中的值，而不能读取score。当data-type为string时，只能有一个非主键字段。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
查询作业模板列表 - 数据湖探索 DLI

3，则在“feature”为“basic”或“ai”时填写。若不填写，则使用默认的Spark组件版本号2.3.2。 image String 自定义镜像。格式为：组织名/镜像名:镜像版本。 queue String 用于指定队列，填写已创建DLI的队列名。必须为通用类型的队列。说明：兼容“c

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
了解数据目录、数据库和表 - 数据湖探索 DLI

创建数据库和表时，有权限控制，需要对其他用户授权，其他用户才可查看该用户新建的数据库和表。表的元数据元数据（Metadata）是用来定义数据类型的数据。主要是描述数据自身信息，包含源、大小、格式或其它数据特征。数据库字段中，元数据用于诠释数据仓库的内容。创建表时，会定义元数据，由列名、类型、列描述三列组成。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
Doris维表 - 数据湖探索 DLI
Doris维表 - 数据湖探索 DLI

如需启用缓存配置则“cache.max-rows”和“cache.ttl”选项都必须指定。 lookup.cache.ttl 10 s N 缓存生存时间。 lookup.max-retries 3 N 查找数据库失败时的最大重试次数。示例该示例是从Doris源表读取数据，并输入到 print

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

返回1 CONVERT_TZ(string1, string2, string3) TIMESTAMP 将string2时区的时间string1转换为其在string3时区的对应时间例如：CONVERT_TZ('1970-01-01 00:00:00', 'UTC', 'Country

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

返回1 CONVERT_TZ(string1, string2, string3) TIMESTAMP 将string2时区的时间string1转换为其在string3时区的对应时间例如：CONVERT_TZ('1970-01-01 00:00:00', 'UTC', 'Country

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
弹性资源池CU设置 - 数据湖探索 DLI

最小CU为256CU时，因为受到CU最大设置的控制，该队列不能添加到该弹性资源池。注意事项在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。在全天的任意一个时间段内，弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

“run_mode”为“exclusive_cluster”时，作业类型须为“flink_sql_job”或“flink_opensource_sql_job”。 “run_mode””为“shared_cluster”时作业类型必须为”flink_sql_job“。 edge_group_ids

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
提交SQL作业（推荐） - 数据湖探索 DLI

02”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。当前配置设置为“true”时，DLI不会提前删除分区，而是在运行时覆盖那些有数据写入的分区。 spark.sql.files.maxPartitionBytes 134217728 读取文件时要打包到单个分区中的最大字节数。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

n包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。使用限制创建自定义镜像必须使用DLI提供的基础镜像。不能随意修改基础镜像中DLI相关组件及目录。仅支持Spark jar作业、Flink jar作业，即jar包作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

overwrite语法可能存在数据丢失风险。 "自读自写"是指在处理数据时能够读取数据，同时根据读取的数据生成新的数据或对数据进行修改。使用Hive和Datasource（除Hudi外）表在执行数据修改类命令（例如insert into，load data）时由于数据源不支持事务性，在系统故障或队列资源重

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

overwrite语法可能存在数据丢失风险。 "自读自写"是指在处理数据时能够读取数据，同时根据读取的数据生成新的数据或对数据进行修改。使用Hive和Datasource（除Hudi外）表在执行数据修改类命令（例如insert into，load data）时由于数据源不支持事务性，在系统故障或队列资源重

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关

总条数： 450

上一页
1
...
18
19
20
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDF - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

Doris维表 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线