搜索_华为云

FileSystem结果表 - 数据湖探索 DLI

桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row Formats默认的策略是根据Part文件大小进行滚动，需要指定文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
instr1 - 数据湖探索 DLI
instr1 - 数据湖探索 DLI

类型会返回报错。 start_position 否 BIGINT 表示从str1的第几个字符开始搜索，默认起始位置是第一个字符位置1。当start_position为负数时表示开始位置是从字符串的结尾往前倒数，最后一个字符是-1，依次往前倒数。 nth_appearance 否

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代码的编写与作业的开发，使用Notebook灵活的进行数据分析与探索，本

 帮助中心 > 数据湖探索 DLI > 用户指南
权限管理概述 - 数据湖探索 DLI

务。角色并不能满足用户对精细化授权的要求，无法完全达到企业对权限最小化的安全管控要求。策略：IAM最新提供的一种细粒度授权的能力，可以精确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式，能够满足企业对权限最小化的安全管控要求。例如：针对DLI服务，

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
datediff1 - 数据湖探索 DLI
datediff1 - 数据湖探索 DLI

date1、date2为DATE或STRING类型，但不符合日期值的入参格式时，返回NULL；如果date1小于date2，返回值为负数。 date1或date2值为NULL时，返回NULL。 datepart值为NULL时，返回NULL。示例代码返回14400。 select

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

返回string中从integer1位置开始的长度为integer2的子字符串。若integer2未配置，则默认返回从integer1开始到末尾的子字符串 REPLACE(string1, string2, string3) STRING 用string3代替string1中的string2后的字符串，并返回替换后的string1字符串

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

源表：源表是Flink作业的数据输入表，例如Kafka等实时流数据输入。维表：数据源表的辅助表，用于丰富和扩展源表的数据。在Flink作业中，因为数据采集端采集到的数据往往比较有限，在做数据分析之前，就要先将所需的维度信息补全，而维表就是代表存储数据维度信息的数据源。常见的用户维表有 MySQL，Redis等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
char - 数据湖探索 DLI
char - 数据湖探索 DLI

char_matchcount函数用于计算str1中有多少个字符出现在str2中。命令格式 char_matchcount(string <str1>, string <str2>) 参数说明表1 参数说明参数是否必选参数类型说明 str1、str2 是 STRING 待计算的字符串str1、str2。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
使用DLI分析电商BI报表 - 数据湖探索 DLI

某电商商城在保持高速发展的同时，沉淀了数亿的忠实用户，积累了海量的真实数据。如何利用BI工具从历史数据中找出商机，是大数据应用在精准营销中的关键问题，也是所有电商平台在做智能化升级时所需要的核心技术。本案例以某商城真实的用户、商品、评论数据（脱敏后）为基础，利用数据湖探索来分析用户和商品的各种数

 帮助中心 > 数据湖探索 DLI > 最佳实践
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

定数据段中选择所有行，要么跳过它（基于采样百分比与运行时计算的随机值之间的比较）。系统采样中行的选择依赖于使用的connector。例如，如果使用Hive数据源，这将取决于数据在OBS上的布局。这种采样方法不能保证独立的抽样概率。 SELECT * FROM users TABLESAMPLE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
FileSytem结果表 - 数据湖探索 DLI

type' = '' ); 注意事项该建表语法的数据输出目录为OBS时，OBS必须为并行文件系统，不能为OBS桶。使用fileSystem时必须开启checkpoint，保证作业的一致性。 format.type为parquet时，支持的数据类型为string, boolean, tinyint

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

GROUP BY GROUP BY GROUP BY将SELECT语句的输出行划分成包含匹配值的分组。简单的GROUP BY可以包含由输入列组成的任何表达式，也可以是按位置选择输出列的序号。以下查询是等效的： SELECT count(*), nationkey FROM customer

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
DLI作业开发流程 - 数据湖探索 DLI

您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python

帮助中心 > 数据湖探索 DLI > 用户指南
日期、时间函数及运算符 - 数据湖探索 DLI

timestamp1, timestamp2) → bigint 返回timestamp2 - timestamp1之后的值，该值的表示单位是unit。 unit的值是字符串。例如：‘day’、‘week’、‘year’ SELECT date_diff('second', TIMESTAMP

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用Hive语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS语句将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不论在创建t

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
Flink OpenSource SQL1.15语法概览 - 数据湖探索 DLI

OpenSource SQL1.15语法概览本章节介绍目前DLI所提供的Flink OpenSource SQL1.15语法列表。参数说明，示例等详细信息请参考具体的语法说明。创建表相关语法表1 创建表相关语法语法分类功能描述 Format Avro Canal Confluent

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
算术函数 - 数据湖探索 DLI
算术函数 - 数据湖探索 DLI

返回无比接近 pi 的值。 E() 返回无比接近 e 的值。 RAND() 返回 [0.0, 1.0) 范围内的伪随机双精度值。 RAND(INT) 返回范围为 [0.0, 1.0) 的伪随机双精度值，初始种子为 INT。如果两个 RAND 函数具有相同的初始种子，它们将返回相同的数字序列。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Flink OpenSource SQL1.10语法概览 - 数据湖探索 DLI

OpenSource SQL1.10语法概览本章节介绍目前DLI所提供的Flink OpenSource SQL语法列表。参数说明，示例等详细信息请参考具体的语法说明。创建源表相关语法表1 创建源表相关语法语法分类功能描述创建源表 Kafka源表 DIS源表 JDBC源表 DWS源表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考
max - 数据湖探索 DLI
max - 数据湖探索 DLI

STRING类型。指定表名。必须对表有读权限。返回值说明返回STRING类型的值。返回最大的一级分区的值。如果只是用alter table的方式新加了一个分区，但是此分区中并无任何数据，则此分区不会做为返回值。示例代码例如 table1 是分区表，该表对应的分区为20120801和

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
Spark SQL常用配置项说明 - 数据湖探索 DLI

并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考

总条数： 170

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

FileSystem结果表 - 数据湖探索 DLI

instr1 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

datediff1 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

char - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

日期、时间函数及运算符 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

Flink OpenSource SQL1.15语法概览 - 数据湖探索 DLI

算术函数 - 数据湖探索 DLI

Flink OpenSource SQL1.10语法概览 - 数据湖探索 DLI

max - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线