搜索_华为云

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表2 弹性资源池添加队列基础配置参数名称参数说明名称弹性资源池添加的队列名称。类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
数学运算函数 - 数据湖探索 DLI

计算给定A的正弦值。 COS(A) 所有数字类型计算给定A的余弦值。 TAN(A) 所有数字类型计算给定A的正切值。 COT(A) 所有数字类型计算给定A的余切值。 ASIN(A) 所有数字类型计算给定A的反正弦值。 ACOS(A) 所有数字类型计算给定A的反余弦值。 ATAN(A)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
函数概览 - 数据湖探索 DLI
函数概览 - 数据湖探索 DLI

<default>]) 参数的数据类型实现if-then-else分支选择的功能。 javahash javahash(string a) STRING 返回hash值。 max_pt max_pt(<table_full_name>) STRING 返回分区表的一级分区中有数据的分区的最大值，按字母排序，且读取该分区下对应的数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
关系运算符 - 数据湖探索 DLI
关系运算符 - 数据湖探索 DLI

关系运算符所有数据类型都可用关系运算符进行比较，并返回一个BOOLEAN类型的值。关系运算符均为双目操作符，被比较的两个数据类型必须是相同的数据类型或者是可以进行隐式转换的类型。 DLI提供的关系运算符，请参见表1。表1 关系运算符运算符返回类型描述 A = B BOOLEAN

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 运算符
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

实现海量数据的秒级交互式查询。 DLI+HetuEngine能够快速处理大规模数据集的查询请求，迅速和高效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应： HetuEngine通过自动优化资源与负载的配比，能够对TB

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

置导入数据的类型，例如将data_type设置为csv。csv数据的具体格式通可过options参数设置，例如：csv的分隔符，转义符等。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
Hudi常见配置参数 - 数据湖探索 DLI

有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite.insert.split.size 插入写入并行度。为单个分区的总共插入次数。写出100MB的文件，至少1KB大小的记录，意味着

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
分析窗口函数概览 - 数据湖探索 DLI

first_value(col) 参数的数据类型返回结果集中某列第一条数据的值。 last_value last_value(col) 参数的数据类型返回结果集中某列最后一条数据的值。 lag lag (col,n,DEFAULT) 参数的数据类型用于统计窗口内往上第n行值。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
在DLI控制台配置数据库权限 - 数据湖探索 DLI

显示所有角色和用户的绑定关系：显示所有角色和用户的绑定关系。创建函数：在当前数据库创建函数。删除函数：删除当前数据库中的函数。显示所有函数：显示当前数据库中的所有函数。显示函数详情：显示当前函数详情。只适用于“用户授权”的权限包括：显示所有表：显示当前数据库下的所有表。说明：

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
配置DLI云服务委托权限 - 数据湖探索 DLI

仅在勾选该权限且更新DLI委托权限后的项目生效。未勾选该权限的项目不具备跨源场景所需权限、和SMN发送通知消息的权限。示例1：在项目A配置DLI的基础使用、跨源场景、运维场景的权限和示例2：在项目B配置DLI的基础使用、跨源场景、运维场景的权限给出了同一个区域的不同项目更新DLI委托带来的委托权限差异。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

窗口Top-N 功能描述窗口 Top-N 是特殊的 Top-N，它返回每个分区键的每个窗口的N个最小或最大值。与普通Top-N不同，窗口Top-N只在窗口最后返回汇总的Top-N数据，不会产生中间结果。窗口 Top-N 会在窗口结束后清除不需要的中间状态。窗口 Top-N 适用于用户

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

json数据类型的数据，输出到日志文件中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据Kafka的地址测试队列连通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hudi表分区设计规范 - 数据湖探索 DLI

为各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样会出现越细粒度的分区，桶的个数会冗余越多。例如：采用天级分区，平均的日增数据量是3GB，最多一天的日志是8GB，这个会采用Bucket桶数= 8GB/2GB = 4 来创建表；每天的更新数据占比

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
SDK获取与安装 - 数据湖探索 DLI

SDK获取与安装 Python SDK安装方式本节操作介绍安装Python SDK的操作指导。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。 “dli-sdk-python-x.x.x.zip”压缩包，解压后目录结构如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

在下拉列表中选择要使用的队列。选择Spark版本。在下拉列表中选择支持的Spark版本，推荐使用最新版本。不建议长期混用不同版本的Spark/Flink引擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Hudi表索引设计规范 - 数据湖探索 DLI

基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法平衡Bueckt桶过大的问题，还是可以继续采用Flink状态索引，按照规范去优化对应的配置参数即可。建议基于Flink的流式写入的表，在数据量超

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范

总条数： 220

上一页
1
...
6
7
8
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

函数概览 - 数据湖探索 DLI

关系运算符 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

分析窗口函数概览 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线