搜索_华为云

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

准备一个linux弹性云服务器ECS，用于安装DLI Livy。 ECS需要放通30000至32767端口、8998端口。具体操作请参考添加安全组规则。 ECS需安装Java JDK，JDK版本建议为1.8。配置Java环境变量JAVA_HOME。查询弹性云服务器ECS详细信息，获取ECS的“私有IP地址”。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
创建并提交SQL作业 - 数据湖探索 DLI

或者双击左侧表名“qw”，上述查询语句会自动在作业编辑窗口中输入。 DLI还为您提供了丰富的SQL模板，每种模板都为您提供了使用场景、代码示例和使用指导。您也可以直接使用SQL作业模板快速实现您的业务逻辑。了解模板更多信息请参考创建SQL作业模板。单击“更多”中的“语法校验”，确认SQL语句书写是否正确。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
创建IAM用户并授权使用DLI - 数据湖探索 DLI

创建IAM用户并授权使用DLI 如果您需要对您所拥有的DLI资源进行精细的权限管理，您可以使用统一身份认证服务（Identity and Access Management，简称IAM），具体IAM使用场景可以参考权限管理概述。如果华为云账号已经能满足您的要求，不需要创建独立的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

接到Kyuubi服务器。步骤3：配置Power BI使用ODBC连接到Kyuubi：在BI工具中创建一个新的数据连接，使用ODBC作为数据源，通过ODBC连接Kyuubi。步骤1：安装并配置Kyuubi连接DLI 如需使用外网访问Kyuubi请确保弹性云服务器绑定弹性公网IP

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用CES监控DLI服务 - 数据湖探索 DLI

队列CPU使用率展示用户队列的CPU使用率。该指标仅适用于普通队列。 0~100 队列 5分钟 queue_disk_usage 队列磁盘使用率展示用户队列的磁盘使用率。该指标仅适用于普通队列。 0~100 队列 5分钟 queue_disk_used 队列磁盘使用率最大值

 帮助中心 > 数据湖探索 DLI > 用户指南
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

thon程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DL

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用HetuEngine on Hudi - 数据湖探索 DLI

使用HetuEngine on Hudi HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine对Hudi仅支持select操

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

减少磁盘上的存储。使用DLI可轻松将CSV格式数据转换为Parquet格式数据。方案架构将CSV格式的数据上传到对象存储服务OBS，使用DLI将CSV数据转换为Parquet数据，并将转换后的Parquet数据存储到OBS中。图1 方案简介流程指导使用DLI将CSV数据

 帮助中心 > 数据湖探索 DLI > 最佳实践
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

SDK让您无需关心请求细节即可快速使用数据湖探索服务。本节操作介绍如何在Python环境获取并使用SDK。使用须知要使用DLI Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

2024年5月起，新用户可以直接使用DLI服务的“查询结果写入桶”功能，无需开通白名单。对于2024年5月之前首次使用DLI服务的用户，如需使用“查询结果写入桶”功能，必须提交工单申请加入白名单。 DLI支持13种数据类型，每一种类型都可以映射成一种JDBC类型，在使用JDBC连接服务器时，请使用映射后的JAVA类型，映射关系如表1所示。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

在IAM创建策略来管理DLI的权限控制。两种权限控制机制可以共同使用，没有冲突。发布区域：全部创建用户并授权使用DLI DLI自定义策略 DLI常用操作与系统权限关系 OBS 2.0支持弹性资源池和队列使用DLI提交作业前，您需要为提交作业准备所需的计算资源。 · 弹性资

 帮助中心 > 数据湖探索 DLI > 功能总览
Hudi表使用约束 - 数据湖探索 DLI

Write Amplification（写放大）高低（取决于compaction策略） Hudi表使用约束与限制 Hudi支持使用Spark SQL操作Hudi的DDL/DML的语法。但在使用DLI提供的元数据提交SparkSQL作业时，部分直接操作OBS路径的SQL语法暂不支持，详细说明请参考DLI

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
配置DLI访问其他云服务的委托权限 - 数据湖探索 DLI

配置DLI访问其他云服务的委托权限 DLI委托概述创建DLI自定义委托权限常见场景的委托权限策略典型场景DLI委托权限配置示例

 帮助中心 > 数据湖探索 DLI > 用户指南
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？在Flink 作业中，可以使用CREATE语句来定义Source表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在创建的新数据源配置界面中，输入Kyuubi服务器的相关信息。数据库名称：本例输入DLI数据库名称。服务器地址：输入Kyuubi服务器的弹性公网IP地址。端口号：Kyuubi服务监听的端口，使用Hive Thirft协议，默认端口10009。用户名和密码：按需配置Kyuubi服务器用户名和密码。按需配置其他高级选项，然后保存配置。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

使用前必读使用须知 DLI HetuEngine功能为白名单功能，如需使用，请在管理控制台右上角，选择“工单 > 新建工单”，提交申请。使用前您需要先创建一个HetuEngine类型的SQL队列，具体操作请参考创建弹性资源池并添加队列。 HetuEngine SQL需搭配la

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

详细的数据说明请参考数据说明。图1 方案简介流程指导使用DLI进行驾驶行为数据分析的操作过程主要包括以下步骤：步骤1：上传数据。将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。步骤2：分析数据。使用DLI对待分析的数据进行查询。示例代码具体样例数据及详细SQL语句可以通过数据包进行下载。

帮助中心 > 数据湖探索 DLI > 最佳实践
使用CDM迁移数据至DLI - 数据湖探索 DLI

使用CDM迁移数据至DLI CDM提供了可视化的迁移任务配置页面，支持多种数据源到数据湖的迁移能力。本节操作介绍使用CDM迁移工具将数据从数据源迁移至DLI的操作步骤。图1 使用CDM迁移数据至DLI操作流程步骤1：创建CDM集群 CDM集群用于执行数据迁移作业，将数据从数据源迁移至DLI。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。您可以使用本文档提供API对数据湖探索进行相关操作，包括队列、SQL作业、Fl

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
查看队列的使用者（废弃） - 数据湖探索 DLI

查看队列的使用者（废弃）功能介绍该API用于查询可以使用的指定队列的所有用户名称。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v1.0/{project_id}/queues/{queue_name}/users

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）

总条数： 1013

上一页
1
2
3
4
5
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

创建IAM用户并授权使用DLI - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用CES监控DLI服务 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用HetuEngine on Hudi - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

配置DLI访问其他云服务的委托权限 - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

概述 - 数据湖探索 DLI

查看队列的使用者（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线