搜索_华为云

功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

0支持弹性资源池和队列使用DLI提交作业前，您需要为提交作业准备所需的计算资源。 · 弹性资源池和队列：弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），灵活应对业务对计算资源变化的需求。同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。

帮助中心 > 数据湖探索 DLI > 功能总览
创建路由（废弃） - 数据湖探索 DLI

执行请求是否成功。“true”表示请求执行成功。 message String 系统提示信息，执行成功时，信息可能为空。请求示例创建路由，自定义增强型跨源连接的下一跳的路由信息为127.0.0.0。 { "name": "route", "cidr": "127.0.0.0" } 响应示例

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 增强型跨源连接相关API（废弃）
数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

通常按需计费的队列，在空闲1h后计算资源会被释放，再次使用时，需要重新分配计算资源，可能会耗费5~10min时间。按需计费以小时为单位进行结算。不足一小时按一小时计费，小时数按整点计算。例如 12:10 ~12:30、12:10 ~12:55 期间使用，则收取1个小时的费用。具体的计费模式请参考：计费说明。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
round - 数据湖探索 DLI
round - 数据湖探索 DLI

round函数用于计算a的四舍五入到d位的值。命令格式 round(DOUBLE a, INT d) 参数说明表1 参数说明参数是否必选参数类型说明 a 是 DOUBLE、BIGINT、DECIMAL、STRING类型。代表需要被四舍五入的值。参数a的格式包括浮点数格式、整数格式、字符串格式。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
corr - 数据湖探索 DLI
corr - 数据湖探索 DLI

LLINT、TINYINT、FLOAT、DECIMAL类型数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）和价格（price）的相关系数。命令示例如下： select corr(items,price)

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

8。配置Java环境变量JAVA_HOME。查询弹性云服务器ECS详细信息，获取ECS的“私有IP地址”。使用增强型跨源连接打通DLI队列和Livy实例所在的VPC网络。具体操作可以参考增强型跨源连接。 DLI Livy工具下载及安装本次操作下载的DLI Livy版本为apache-livy-0.7.2.0107-bin

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

如购买按需计费的队列，在使用队列资源时，按照队列CU时进行计费。以小时为单位进行结算。不足一小时按一小时计费，小时数按整点计算。队列CU时按需计费的计算费用=单价*CU数*小时数。数据说明详单数据车辆上报的详单数据，包括定时上报的位置记录和异常的驾驶行为触发的告警事件数据。表2

帮助中心 > 数据湖探索 DLI > 最佳实践
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
variance/var - 数据湖探索 DLI
variance/var - 数据湖探索 DLI

variance/var_pop函数用于返回列的方差。命令格式 variance(col), var_pop(col) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。参数为其他类型的列返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的方差。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
stddev - 数据湖探索 DLI
stddev - 数据湖探索 DLI

stddev_samp函数用于返回指定列的样本偏差。命令格式 stddev_samp(col) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的样本偏差。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_count regexp_count函数用于计算source中从start_position位置开始，匹配指定pattern的子串数。命令格式 regexp_count(string <source>, string <pattern>[, bigint <start_position>])

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
修改弹性资源池的主机信息 - 数据湖探索 DLI

修改弹性资源池的主机信息操作场景主机信息用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。在跨源连接创建完成后，支持修改主机信息。常见的访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。约束限制已获取MR

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Hudi表索引设计规范 - 数据湖探索 DLI

基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法平衡Bueckt桶过大的问题，还是可以继续采用Flink状态索引，按照规范去优化对应的配置参数即可。建议基于Flink的流式写入的表，在数据量超

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务弹性扩缩容定时任务使用场景通常，用户业务繁忙的场景是有周期性的，在某个周期内，用户需要更多的计算资源来处理业务，过了这个周期，则不需要那么多资源。如果用户购买的队列规格比较小，在业务繁忙时会存在资源不足的情况；而如果购买的队列规格比较大，又可能会存在资源浪费的情况。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
DLI常用跨源分析开发方式 - 数据湖探索 DLI

跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

插入数据时省略自增字段：在DLI中插入数据时，对于自增主键字段或其他自动填充的字段，您可以在插入语句中省略这些字段。数据库会自动为这些字段生成值。例如，如果表中有一个名为id的自增主键字段，您可以在插入数据时不包含这个字段，数据库会自动为新插入的行分配一个唯一的id值。使用NULL值：如果您需要在插入数据时

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

Access”是跨源场景访问和使用VPC、子网、路由、对等连接的权限。了解更多DLI委托权限请参考DLI委托权限。选择dli_management_agency需要包含的权限后，并单击“更新委托权限”。图1 更新委托权限委托更新完成后，重新创建跨源连接和运行作业。父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

Hbase结果表功能描述 DLI将作业的输出数据输出到HBase中。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
创建RDS跨源表提示空指针错误怎么办？ - 数据湖探索 DLI

test1', 'passwdauth' = 'xxx', 'encryption' = 'true'); 客户的RDS数据库为PostGre集群，url的协议头填写错误导致。处理步骤修改url为'url'='jdbc:postgresql://to-rds-1174405119-oLRHAGE7

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类

总条数： 898

上一页
1
...
5
6
7
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

功能总览 - 数据湖探索 DLI

创建路由（废弃） - 数据湖探索 DLI

数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

round - 数据湖探索 DLI

corr - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

variance/var - 数据湖探索 DLI

stddev - 数据湖探索 DLI

regexp - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

创建RDS跨源表提示空指针错误怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线