搜索_华为云

DWS Connector概述 - 数据湖探索 DLI

DWS Connector概述数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQ

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
stddev - 数据湖探索 DLI
stddev - 数据湖探索 DLI

参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的样本偏差。命令示例如下： select stddev_samp(items) from warehouse; 返回结果如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
variance/var - 数据湖探索 DLI
variance/var - 数据湖探索 DLI

参数是否必选说明 col 是数据类型为数值的列。参数为其他类型的列返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的方差。命令示例如下： select variance(items) from warehouse; --等效于如下语句。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_count regexp_count函数用于计算source中从start_position位置开始，匹配指定pattern的子串数。命令格式 regexp_count(string <source>, string <pattern>[, bigint <start_position>])

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
covar - 数据湖探索 DLI
covar - 数据湖探索 DLI

数据类型为数值的列。其他类型返回NULL。 col2 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）和价格（price）的协方差。命令示例如下： select covar_pop(items，price) from

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
covar - 数据湖探索 DLI
covar - 数据湖探索 DLI

数据类型为数值的列。其他类型返回NULL。 col2 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）和价格（price）的样本协方差。命令示例如下： select covar_samp(items,price) from

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

n环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新建集群环境均已默认为Python3环境。父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
percentile - 数据湖探索 DLI
percentile - 数据湖探索 DLI

数据类型为数值的列。其他类型返回NULL。 p 是 0<=P<=1,否则返回NULL。返回值说明返回DOUBLE类型的值。 0<=P<=1,否则返回NULL。示例代码计算所有商品库存（items）的 0.5 百分位。命令示例如下： select percentile(items,0.5) from warehouse;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
stddev - 数据湖探索 DLI
stddev - 数据湖探索 DLI

参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的偏差。命令示例如下： select stddev_pop(items) from warehouse; 返回结果如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
var - 数据湖探索 DLI
var - 数据湖探索 DLI

参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的样本方差。命令示例如下： select var_samp(items) from warehouse; 返回结果如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
corr - 数据湖探索 DLI
corr - 数据湖探索 DLI

NYINT、FLOAT、DECIMAL类型数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）和价格（price）的相关系数。命令示例如下： select corr(items,price) from warehouse;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_substr regexp_substr函数用于计算从start_position位置开始，source中第occurrence次匹配指定pattern的子串。命令格式 regexp_substr(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Bitwise函数 - 数据湖探索 DLI
Bitwise函数 - 数据湖探索 DLI

Bitwise函数 bit_count(x, bits) → bigint 计算2的补码表示法中x中设置的位数（视为有符号位的整数）。 SELECT bit_count(9, 64); -- 2 SELECT bit_count(9, 8); -- 2 SELECT bit_count(-7

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
datepart - 数据湖探索 DLI
datepart - 数据湖探索 DLI

datepart datepart函数用于计算日期date中符合指定时间单位datepart的值。命令格式 datepart（string date，string datepart）参数说明表1 参数说明参数是否必选参数类型说明 date 是 DATE 或 STRING

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
lengthb - 数据湖探索 DLI
lengthb - 数据湖探索 DLI

lengthb lengthb函数用于计算字符串str以字节为单位的长度。相似函数：length，length函数用于返回字符串的长度，返回BIGINT类型的值。命令格式 lengthb(string <str>) 参数说明表1 参数说明参数是否必选参数类型说明 str

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.forcePartitionPredicat

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_instr regexp_instr函数用于计算字符串source从start_position开始，与pattern第occurrence次匹配的子串的起始或结束位置。命令格式 regexp_instr(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Livy是基于开源的Apache Livy用于提交Spark作业到DLI的客户端工具。准备工作创建DLI队列。在“队列类型”中选择“通用队列”，即Spark作业的计算资源。具体请参考创建队列。准备一个linux弹性云服务器ECS，用于安装DLI Livy。 ECS需要放通30000至32767端口、8

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
from - 数据湖探索 DLI
from - 数据湖探索 DLI

from_unixtime from_unixtime函数用于计算将数字型的UNIX值代表的时间戳转换为日期值。命令格式 from_unixtime(bigint unixtime) 参数说明表1 参数说明参数是否必选参数类型说明 unixtime 是 BIGINT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数

总条数： 429

上一页
1
2
3
4
5
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DWS Connector概述 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

stddev - 数据湖探索 DLI

variance/var - 数据湖探索 DLI

regexp - 数据湖探索 DLI

covar - 数据湖探索 DLI

covar - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

percentile - 数据湖探索 DLI

stddev - 数据湖探索 DLI

var - 数据湖探索 DLI

corr - 数据湖探索 DLI

regexp - 数据湖探索 DLI

Bitwise函数 - 数据湖探索 DLI

datepart - 数据湖探索 DLI

lengthb - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

regexp - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

from - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线