搜索_华为云

自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

</dependency> 注意事项暂不支持通过python写UDF、UDTF、UDAF自定义函数。如果使用IntelliJ IDEA工具对创建的自定义函数进行调试，则需要在IDEA上勾选：include dependencies with "Provided" scope，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
配置DLI作业桶 - 数据湖探索 DLI

本节操作指导您在DLI管理控制台的“全局配置 > 工程配置”页面配置DLI作业桶。操作前准备配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Serv

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？问题现象客户在数据治理中心DataArts Studio创建DLI的跨源RDS表，执行insert overwrite语句向RDS写入数据报错：DLI.0999: B

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie_approx percentile_approx函数用于计算近似百分位数，适用于大数据量。先对指定列升序排列，然后取第p位百分数最靠近的值。命令格式 percentile_approx (colname,DOUBLE p) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

HetuEngine是华为推出的高性能交互式SQL分析及数据虚拟化引擎，能够与大数据生态无缝融合，实现海量数据的秒级交互式查询。 DLI+HetuEngine能够快速处理大规模数据集的查询请求，迅速和高效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI Python SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下。完整样例代码和依赖包说明请参考：Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
分析窗口函数概览 - 数据湖探索 DLI

分析窗口函数概览 DLI所支持的分析窗口函数如分析窗口函数介绍所示。表1 分析窗口函数介绍函数命令格式返回值功能简介 cume_dist cume_dist() DOUBLE 用于求累计分布，相当于求分区中大于等于或小于等于当前行的数据在分区中的占比。 first_value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI常用跨源分析开发方式跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下：前提条件已参考Java SDK概述配置Java SDK环境。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
SQL作业使用咨询 - 数据湖探索 DLI

timeout（单位是秒）参数配置超时时间。 DLI支撑本地测试Spark作业吗? DLI暂不支持本地测试Spark作业，您可以安装DLI Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark Jar作业。 DLI 表(OBS表 / DLI 表 )数据支持删除某行数据吗？

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
与其他云服务的关系 - 数据湖探索 DLI

Studio）的关系在数据治理中心DataArts Studio中，数据开发是一个一站式的大数据协同开发平台，提供全托管的大数据调度能力。它可管理多种大数据服务，极大降低用户使用大数据的门槛，帮助用户快速构建大数据处理中心。通过数据治理中心的DLI SQL节点传递SQL语句到DLI中执行，请参考《DLI

帮助中心 > 数据湖探索 DLI > 产品介绍
Hudi表索引设计规范 - 数据湖探索 DLI

作业状态后端压力很大，需要优化状态后端参数才能维持性能；同时由于Flink冷启动的时候需要遍历全表数据，大数据量也会导致Flink作业启动缓慢。因此基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

处理。数据查询与分析：提交SQL脚本分析业务数据，例如查询单日销售情况。请参考步骤3：销售情况的查询与分析。作用编排：将数据处理和数据分析脚本编排成一个pipeline。DataArt会按照编排好的pipeline顺序执行各个节点。请参考步骤4：作业编排。测试作业运行：测试作业运行。请参考步骤5：测试作业运行。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

S服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。 MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。具体请参考《MapReduce服务开发指南》。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDF - 数据湖探索 DLI

int b) { return a + b; } } 编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
调用说明 - 数据湖探索 DLI
调用说明 - 数据湖探索 DLI

状态API，从而获取该异步操作API最终是否执行成功。同时数据湖探索还提供多种编程语言的SDK供您使用，SDK的使用方法请参见华为云开发工具包（SDK）。父主题： API使用前必读

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
创建Bucket索引表调优 - 数据湖探索 DLI

最近一个月最大数据量分区数据总条数 = 入湖前咨询产品线单条数据大小 = 平均 1KB（华为建议通过select * from tablename limit 100，得出100条数据的大小，再除以100得到单条平均大小）单分区数据量大小(G) = 最近一个月最大数据量分区数据

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
CSS安全集群配置 - 数据湖探索 DLI

单击“安全模式”中的“下载证书”下载安全证书。使用keytool工具生成keystore和truststore文件。使用keytool工具生成keystore和truststore文件，其中需要使用到安全集群的安全证书（CloudSearchService.cer），keytool工具还有其他参数，可根据需求设置。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

sum; } } } 图8 编写UDAF函数代码编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 185

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自定义函数 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

分析窗口函数概览 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

调用说明 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线