搜索_华为云

var - 数据湖探索 DLI
var - 数据湖探索 DLI

var_samp var_samp函数用于返回指定列的样本方差。命令格式 var_samp(col) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的样本方差。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
corr - 数据湖探索 DLI
corr - 数据湖探索 DLI

corr corr函数用于返回两列数值的相关系数。命令格式 corr(col1, col2) 参数说明表1 参数说明参数是否必选参数类型说明 col1 是 DOUBLE、BIGINT、INT、SMALLINT、TINYINT、FLOAT、DECIMAL类型数据类型为数值的列。其他类型返回NULL。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
percentile - 数据湖探索 DLI
percentile - 数据湖探索 DLI

percentile percentlie函数用于返回数值区域的百分比数值点。命令格式 percentile(BIGINT col, p) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。 p 是 0<=P<=1,否则返回NULL。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
配置DLI云服务委托权限 - 数据湖探索 DLI

配置DLI云服务委托权限使用DLI服务前请先配置DLI云服务权限。本节操作适用于以下场景：首次使用DLI服务，请参考本节操作按需配置DLI云服务委托权限。使用DLI的过程中需要与其他云服务协同工作，因此需要您将部分服务的操作权限委托给DLI服务，确保DLI具备基本使用的权

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
variance/var - 数据湖探索 DLI
variance/var - 数据湖探索 DLI

variance/var_pop variance/var_pop函数用于返回列的方差。命令格式 variance(col), var_pop(col) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。参数为其他类型的列返回NULL。返回值说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

x版本中新增支持Parallel Multi-Insert，如果SQL存在multi-insert的场景，在同一个SQL里插入到多个表中，这类SQL在Spark开源本身是串行处理的，性能受到制约。针对这类SQL，Spark3.3.x版本中DLI新增支持multi-insert并行化的优化处理，可以让所

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
percentile - 数据湖探索 DLI
percentile - 数据湖探索 DLI

percentile_approx percentile_approx函数用于返回组内数字列近似的第p位百分数（包括浮点数）。命令格式 percentile_approx(DOUBLE col, p [, B]) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
二进制函数和运算符 - 数据湖探索 DLI

二进制函数和运算符二进制运算符 || 运算符执行连接。二进制函数 length(binary) → bigint 返回binary的字节长度。 select length(x'00141f');-- 3 concat(binary1, ..., binaryN) → varbinary

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Hudi表使用约束 - 数据湖探索 DLI

Hudi表使用约束 Hudi表类型 Copy On Write 写时复制表也简称COW表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
整数类型 - 数据湖探索 DLI
整数类型 - 数据湖探索 DLI

整数类型表1 整数类型名称描述存储空间取值范围字面量 TINYINT 微整数 8位 -128~127 TINYINT SMALLINT 小整数 16位 -32,768 ~ +32,767 SMALLINT INTEGER 整数 32位 -2,147,483,648 ~

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
数学函数和运算符 - 数据湖探索 DLI

数学函数和运算符数学运算符运算符描述 + 加 - 减 * 乘 / 除 % 取余数学函数 abs(x) → [same as input] 返回x的绝对值 SELECT abs(-17.4);-- 17.4 bin(bigint x) -> string 返回x的二进制格式

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建DLI表关联DCS - 数据湖探索 DLI

创建DLI表关联DCS 功能描述使用CREATE TABLE命令创建DLI表并关联DCS上已有的Key。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
跨源认证概述 - 数据湖探索 DLI

跨源认证概述什么是跨源认证？跨源分析场景中，如果在作业中直接配置认证信息会触发密码泄露的风险，因此推荐您使用“数据加密服务DEW”或“DLI提供的跨源认证方式”来存储数据源的认证信息。数据加密服务（Data Encryption Workshop, DEW）是一个综合的云上

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
终端节点 - 数据湖探索 DLI
终端节点 - 数据湖探索 DLI

终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项更多具体使用可参考开源社区文档：Apache Kafka SQL 连接器。创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

ADD COLUMNS 命令功能 ADD COLUMNS命令用于为现有表添加新列。命令语法 ALTER TABLE tableName ADD COLUMNS(col_spec[, col_spec ...]) 参数描述表1 ADD COLUMNS参数描述参数描述 tableName

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Schema演进语法说明
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类

总条数： 152

上一页
1
...
4
5
6
7
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

var - 数据湖探索 DLI

corr - 数据湖探索 DLI

percentile - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

variance/var - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

percentile - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

整数类型 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

数学函数和运算符 - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

终端节点 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线