搜索_华为云

在Spark SQL作业中使用UDF - 数据湖探索 DLI

IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDF函数开发流程参考如下：图1 开发流程表2 开发流程说明序号阶段操作界面说明 1 新建Maven工程，配置pom文件 IntelliJ IDEA

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
corr - 数据湖探索 DLI
corr - 数据湖探索 DLI

price) from warehouse; 返回结果如下： _c0 1.242355 与group by配合使用，对所有商品按照仓库（warehourseId）进行分组，并计算同组商品库存（items）和价格（price）的相关系数。命令示例如下： select warehourseId

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
在DLI控制台创建数据库和表 - 数据湖探索 DLI

在DLI控制台创建数据库和表数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。表是数据库最重要的组成部分之一。表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

0</log4j.version> <maven.compiler.source>8</maven.compiler.source> <maven.compiler.target>8</maven.compiler.target> </properties>

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

1或其2019.1往后的版本。安装Maven 开发环境的基本配置（下载并安装 Maven）。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDAF函数开发流程参考如下：图1 UDAF开发流程表2 开发流程说明序号阶段操作界面说明 1 新建Maven工程，配置pom文件 IntelliJ

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDTF函数开发流程参考如下：图1 UDTF开发流程表2 开发流程说明序号阶段操作界面说明 1 新建Maven工程，配置pom文件 IntelliJ

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

分布式缓存服务DCS相关介绍请参考《分布式缓存服务产品介绍》。文档数据库服务DDS相关介绍请参考《文档数据库服务产品介绍》。数据仓库服务GaussDB（DWS）相关介绍请参考《数据仓库服务产品介绍》。 MapReduce服务MRS相关介绍请参考《MapReduce服务产品介绍》。云数据库RDS

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

0</log4j.version> <maven.compiler.source>8</maven.compiler.source> <maven.compiler.target>8</maven.compiler.target> </properties>

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 Power BI提供了数据集成、数据仓库、报告和数据可视化等功能，能够将复杂的数据转换为易于理解和交互的可视化图表和仪表板，从而帮助企业做出基于数据的决策。 Kyuubi是一个分布式SQL查询引擎，它允许用户通过标准的SQL接口来访问和分析数据。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

Hive源表简介 Apache Hive 已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误问题描述提交Flink Jar作业访问DWS数据仓库服务时，提示启动失败，作业日志报如下错误信息。 FATAL: Already too many clients, active/non-active/reserved:

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
查看表元数据 - 数据湖探索 DLI

元数据（Metadata）是用来定义数据类型的数据。主要是描述数据自身信息，包含源、大小、格式或其它数据特征。数据库字段中，元数据用于诠释数据仓库的内容。创建表时，会定义元数据，由列名、类型、列描述三列组成。 “元数据”页面将显示目标表的列名、列类型、类型和描述。查看元数据步骤

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
迁移数据场景概述 - 数据湖探索 DLI

以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。图1 迁移数据至DLI 常见迁移场景与迁移方案指导

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
了解数据目录、数据库和表 - 数据湖探索 DLI

在DLI数据目录库下创建数据库和表请参考在DLI控制台创建数据库和表。数据库数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。数据库通常用于存储、检索和管理结构化数据，由多个数据表组成，这些数据表通过键和索引相互关联。表表是数据库最重要的组成部分之一，它由行

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

并且基于开源社区版本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者Sbt构建工具中将scope设为provided 日志配置文件（例如l：“log4j.properties”或者“logback.xml”等）

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

et”的文件夹。步骤3：新建Maven工程，配置pom依赖以下通过IntelliJ IDEA 2020.2工具操作演示。打开IntelliJ IDEA，选择“File > New > Project”。图3 新建Project 选择Maven，Project SDK选择1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
数据迁移与传输方式概述 - 数据湖探索 DLI

数据迁移与传输方式概述导入数据至OBS DLI支持在不迁移数据的情况下，直接访问OBS中存储的数据进行查询分析。您只需将本地数据导入OBS即可开始使用DLI进行数据分析。导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码中“pom文件配置”说明。 pom文件配置中依赖包 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

warehouse.dir”。步骤3：新建Maven工程，配置pom依赖以下通过IntelliJ IDEA 2020.2工具操作演示。打开IntelliJ IDEA，选择“File > New > Project”。图3 新建Project 选择Maven，Project SDK选择1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码 Maven依赖 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS

总条数： 105

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDF - 数据湖探索 DLI

corr - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

概述 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

查看表元数据 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线