搜索_华为云

Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

a8c3-28fbee399fa6"; // 调用BatchJob对象的delBatch接口取消批处理作业 MessageInfo messageInfo = client.delBatchJob(batchId); System.out.println(messageInfo

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
使用Hive语法创建OBS表 - 数据湖探索 DLI

short, int, bigint, long, decimal, float, double, date, timestamp等hive开源支持的类型。支持指定多个分区字段，分区字段只需在PARTITIONED BY关键字后指定，不能像普通字段一样在表名后指定，否则将出错。单表分区数最多允许200000个。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI Python SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下。完整样例代码和依赖包说明请参考：Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

DLI SDK简介 DLI SDK简介数据湖探索服务软件开发工具包（DLI SDK，Data Lake Insight Software Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI

帮助中心 > 数据湖探索 DLI > SDK参考
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark Jar作业读取和查询OBS数据。配置S

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

SQL 标准，在支持基于窗口的复杂计算上也更强大。例如：窗口 TopN、窗口 Join。而分组窗口函数只支持窗口聚合。更多介绍和使用请参考开源社区文档：窗口函数。窗口函数简介 Apache Flink 提供3个内置的窗口表值函数：TUMBLE，HOP 和 CUMULATE。窗

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
SQL作业使用咨询 - 数据湖探索 DLI

timeout（单位是秒）参数配置超时时间。 DLI支撑本地测试Spark作业吗? DLI暂不支持本地测试Spark作业，您可以安装DLI Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark Jar作业。 DLI 表(OBS表 / DLI 表 )数据支持删除某行数据吗？

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下：前提条件已参考Java SDK概述配置Java SDK环境。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
CSS安全集群配置 - 数据湖探索 DLI

单击“安全模式”中的“下载证书”下载安全证书。使用keytool工具生成keystore和truststore文件。使用keytool工具生成keystore和truststore文件，其中需要使用到安全集群的安全证书（CloudSearchService.cer），keytool工具还有其他参数，可根据需求设置。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

</dependency> 注意事项暂不支持通过python写UDF、UDTF、UDAF自定义函数。如果使用IntelliJ IDEA工具对创建的自定义函数进行调试，则需要在IDEA上勾选：include dependencies with "Provided" scope，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
迁移数据场景概述 - 数据湖探索 DLI

迁移数据场景概述为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
使用CDM迁移数据至DLI - 数据湖探索 DLI

使用CDM迁移数据至DLI CDM提供了可视化的迁移任务配置页面，支持多种数据源到数据湖的迁移能力。本节操作介绍使用CDM迁移工具将数据从数据源迁移至DLI的操作步骤。图1 使用CDM迁移数据至DLI操作流程步骤1：创建CDM集群 CDM集群用于执行数据迁移作业，将数据从数据源迁移至DLI。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
数据迁移与传输方式概述 - 数据湖探索 DLI

导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
使用CTS审计DLI服务 - 数据湖探索 DLI

edsconnection deleteRoute 创建批处理作业 jobs createBatch 取消批处理作业 jobs cancelBatch 创建全局变量 variable createGlobalVariable 删除全局变量 variable deleteGlobalVariable

帮助中心 > 数据湖探索 DLI > 用户指南
调用说明 - 数据湖探索 DLI
调用说明 - 数据湖探索 DLI

状态API，从而获取该异步操作API最终是否执行成功。同时数据湖探索还提供多种编程语言的SDK供您使用，SDK的使用方法请参见华为云开发工具包（SDK）。父主题： API使用前必读

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Spark3.3.1基础镜像内置了3.1.62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 pom文件配置中依赖包 <dependency> <groupId>com.huaweicloud.sdk</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

sum; } } } 图8 编写UDAF函数代码编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
整数类型 - 数据湖探索 DLI
整数类型 - 数据湖探索 DLI

整数类型表1 整数类型名称描述存储空间取值范围字面量 TINYINT 微整数 8位 -128~127 TINYINT SMALLINT 小整数 16位 -32,768 ~ +32,767 SMALLINT INTEGER 整数 32位 -2,147,483,648 ~

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程 DLI进行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

1.10以上版本，certifi，python-dateutil。关于Python SDK的获取与安装请参考SDK获取与安装。使用SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Toke

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK

总条数： 130

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark作业相关 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

调用说明 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

整数类型 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线