搜索_华为云

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。通过管

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
聚合函数概览 - 数据湖探索 DLI

col2) DOUBLE 返回两列数值协方差。 covar_samp covar_samp(col1, col2) DOUBLE 返回两列数值样本协方差。 max max(col) DOUBLE 返回最大值。 min min(col) DOUBLE 返回最小值。 percentile

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回所有输入值之间的数字字段的样本方差 COLLECT([ ALL | DISTINCT ] expression) MULTISET 返回所有输入值的MULTISET VARIANCE([ ALL | DISTINCT ] expression) DOUBLE 返回所有输入值之间的数字字段的样本方差

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回所有输入值之间的数字字段的样本方差 COLLECT([ ALL | DISTINCT ] expression) MULTISET 返回所有输入值的MULTISET VARIANCE([ ALL | DISTINCT ] expression) DOUBLE 返回所有输入值之间的数字字段的样本方差

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

expression) VAR_SAMP() 的同义方法。 RANK() 返回值在一组值中的排名。结果是 1 加上分区顺序中当前行之前或等于当前行的行数。排名在序列中不一定连续。 DENSE_RANK() 返回值在一组值中的排名。结果是一加先前分配的等级值。与函数 rank 不同，dense_rank

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
var - 数据湖探索 DLI
var - 数据湖探索 DLI

var_samp函数用于返回指定列的样本方差。命令格式 var_samp(col) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的样本方差。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
stddev - 数据湖探索 DLI
stddev - 数据湖探索 DLI

stddev_samp函数用于返回指定列的样本偏差。命令格式 stddev_samp(col) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的样本偏差。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
covar - 数据湖探索 DLI
covar - 数据湖探索 DLI

数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）和价格（price）的样本协方差。命令示例如下： select covar_samp(items,price) from warehouse; 返回结果如下： _c0 1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
数学函数和运算符 - 数据湖探索 DLI

返回介于0和n（不包括n）之间的伪随机数 select random(5);-- 2 random(n)包含数据类型tinyint，bigint，smallint，integer。统计学函数二项分布的置信区间有多种计算公式，最常见的是["正态区间"]，但是，它只适用于样本较多的情况（np

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

I SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算资源按租户隔离，数据权限控制到队列、作业，帮助企业实现部门间的数据共享和权限管理。 Serverless DLI DLI完全兼容Apache

帮助中心 > 数据湖探索 DLI > 产品介绍
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。本例介绍通过DLI控制

 帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DLI查询数据前，需要将数据文件上传至OBS中。步骤2：创建弹性资源池并添加队列创建提交作业所需的计算资源。步骤3：创建数据库 DLI元数据是SQL作业开发的基础。在执行作业前您需要根据业务场景定义数据库和表。步骤4：创建表数据库创建完成后，需要在数据库db1中基于OBS上的样本数据创建表。步骤5：查询数据

 帮助中心 > 数据湖探索 DLI > 快速入门
Spark作业使用咨询 - 数据湖探索 DLI

详细操作请参考访问DWS和访问SQL库表。如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。查看Spark内置依赖包的版本请参考内置依赖包。资源包管理中的包是否能够下载

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

看来，峰度反映了峰部的尖度。这个统计量需要与正态分布相比较。定义上峰度是样本的标准四阶中心矩（standardized 4th central moment)。随机变量的峰度计算方法为随机变量的四阶中心矩与方差平方的比值。具体计算公式为： select kurtosis(x)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
DLI作业开发流程 - 数据湖探索 DLI

可通过交互式会话（session）和批处理（batch）方式提交计算任务。通过在DLI提供的弹性资源池队列上提交作业，简化了资源管理和作业调度。支持多种数据源和格式，提供了丰富的数据处理能力，包括但不限于SQL查询、机器学习等。详细操作请参考创建Spark作业。适用于大规模数据处理和分析，如机器学

 帮助中心 > 数据湖探索 DLI > 用户指南
程序包管理概述 - 数据湖探索 DLI

Jar包或Jar作业程序包上传到云平台进行统一的管理和维护。有以下两种方式管理程序包：（推荐使用）上传至OBS管理程序包：提前将对应的jar包上传至OBS桶中，在作业配置时选择对应的OBS路径。（DLI程序包功能即将停用）上传至DLI管理程序包：提前将对应的jar包上传至OBS桶中，并在DLI管理控制台

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
substring - 数据湖探索 DLI
substring - 数据湖探索 DLI

substring_index substring_index函数用于截取字符串str第count个分隔符之前的字符串。如果count为正，则从左边开始截取。如果count为负，则从右边开始截取。命令格式 substring_index(string <str>, string <separator>

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数

总条数： 673

上一页
1
2
3
4
5
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

聚合函数概览 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

var - 数据湖探索 DLI

stddev - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

covar - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

数学函数和运算符 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

substring - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线