搜索_华为云

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。使用限制创建自定义镜像必须使用DLI提供的基础镜像。不能随意修改基础镜像中DLI相关组件及目录。仅支持Spark jar作业、Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
使用Hive语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS语句将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
使用Hive语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表功能描述使用Hive语法创建OBS表。DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文件系统是一种高性能文件系统，提供毫

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

码的编写与作业的开发，使用Notebook灵活的进行数据分析与探索，本节操作介绍使用Notebook作业提交DLI作业的操作步骤。关于Jupyter Notebook的详细操作指导，请参见Jupyter Notebook使用文档。使用Notebook实例提交DLI作业适用于在

 帮助中心 > 数据湖探索 DLI > 用户指南
在Spark SQL作业中使用UDF - 数据湖探索 DLI

SQL作业中使用UDF 操作场景 DLI支持用户使用Hive UDF（User Defined Function，用户定义函数）进行数据查询等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

准备工作已注册华为账号并开通华为云，且在使用DLI前检查账号状态，账号不能处于欠费或冻结状态。配置DLI委托访问授权 DLI使用过程中涉及到OBS、VPC、SMN等服务交互，首次使用DLI需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录DLI管理控制台，在左侧导航栏单击“全局配置

 帮助中心 > 数据湖探索 DLI > 快速入门
SQL作业使用咨询 - 数据湖探索 DLI

SQL作业使用咨询 DLI是否支持创建临时表？问题描述：临时表主要用于存储临时中间结果，当事务结束或者会话结束的时候，临时表的数据可以自动删除。例如MySQL中可以通过：“create temporary table ...” 语法来创建临时表，通过该表存储临时数据，结束事务或

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用DataSource语法创建OBS表功能描述本节介绍使用DataSource语法创建OBS表。 DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
SHOW语法使用概要 - 数据湖探索 DLI

SHOW语法使用概要 SHOW语法主要用来查看数据库对象的相关信息，其中LIKE子句用来对数据库对象过滤，匹配规则如下，具体示例可参看SHOW TABLES：规则1：_可以用来匹配单个任意字符。规则2：%可以用来匹配0个或者任意个任意字符。规则3：* 可以用来匹配0个或者任意个任意字符。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

详细的数据说明请参考数据说明。图1 方案简介流程指导使用DLI进行驾驶行为数据分析的操作过程主要包括以下步骤：步骤1：上传数据。将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。步骤2：分析数据。使用DLI对待分析的数据进行查询。示例代码具体样例数据及详细SQL语句可以通过数据包进行下载。

帮助中心 > 数据湖探索 DLI > 最佳实践
使用HetuEngine on Hudi - 数据湖探索 DLI

使用HetuEngine on Hudi HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine对Hudi仅支持select操

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Spark作业使用咨询 - 数据湖探索 DLI

Spark作业使用咨询 DLI Spark作业是否支持定时周期任务作业 DLI Spark不支持作业调度，用户可以通过其他服务，例如数据湖管理治理中心DataArts Studio服务进行调度，或者通过API/SDK等方式对作业进行自定义调度。使用DataArts Studi

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

使用前必读使用须知 DLI HetuEngine功能为白名单功能，如需使用，请在管理控制台右上角，选择“工单 > 新建工单”，提交申请。使用前您需要先创建一个HetuEngine类型的SQL队列，具体操作请参考创建弹性资源池并添加队列。 HetuEngine SQL需搭配la

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
使用DataSource语法创建DLI表 - 数据湖探索 DLI

序也必须对应。否则将出错。单表分区数最多允许200000个。 2024年1月后新注册使用DLI服务的用户，且使用Spark3.3及以上版本的引擎，在使用DataSource语法创建表时支持使用CTAS创建分区表。语法格式 1 2 3 4 5 6 7 CREATE TABLE [IF

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
使用CES监控DLI服务 - 数据湖探索 DLI

队列CPU使用率展示用户队列的CPU使用率。该指标仅适用于普通队列。 0~100 队列 5分钟 queue_disk_usage 队列磁盘使用率展示用户队列的磁盘使用率。该指标仅适用于普通队列。 0~100 队列 5分钟 queue_disk_used 队列磁盘使用率最大值

 帮助中心 > 数据湖探索 DLI > 用户指南
API使用前必读 - 数据湖探索 DLI

API使用前必读概述调用说明终端节点约束与限制基本概念

 帮助中心 > 数据湖探索 DLI > API参考
GROUP BY中使用HAVING - 数据湖探索 DLI

GROUP BY中使用HAVING 功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY groupby_expression[, groupby_expression…

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
使用DLI分析账单消费数据 - 数据湖探索 DLI

使用DLI分析账单消费数据应用场景本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：

帮助中心 > 数据湖探索 DLI > 最佳实践
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Hudi表使用约束 - 数据湖探索 DLI

Write Amplification（写放大）高低（取决于compaction策略） Hudi表使用约束与限制 Hudi支持使用Spark SQL操作Hudi的DDL/DML的语法。但在使用DLI提供的元数据提交SparkSQL作业时，部分直接操作OBS路径的SQL语法暂不支持，详细说明请参考DLI

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述

总条数： 1006

上一页
1
2
3
4
5
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

SHOW语法使用概要 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

使用HetuEngine on Hudi - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

使用CES监控DLI服务 - 数据湖探索 DLI

API使用前必读 - 数据湖探索 DLI

GROUP BY中使用HAVING - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线