搜索_华为云

Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
DLI常用跨源分析开发方式 - 数据湖探索 DLI

同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。推荐使用增强型跨源连接打通DLI与数据源之间的网络。跨源分析开发方式表1提供DLI支持的数据源对应的开发方式。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
监控安全风险 - 数据湖探索 DLI

助用户监控账号下的DLI队列，执行自动实时监控、告警和通知操作。用户可以实时掌握队列中的运行作业网络流入速率、网络流出速率、CPU使用率、内存使用率、磁盘利用率、失败作业率、等待作业数等信息。还可以通过云监控服务提供的管理控制台或API接口来检索数据湖探索服务产生的监控指标和告警信息。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的这种模式减轻了运维负担，可以更专注于数据处理和分析任务本身。具体请参考《数据湖探索用户指南》。 M

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

JSON函数 JSON函数使用SQL标准的ISO/IEC TR 19075-6中描述的JSON路径表达式。它们的语法受到ECMAScript的启发并采用了ECMAScript的许多特性，但既不是其子集，也不是其超集。路径表达式有两种，一种是宽松模式，另一种是严格模式。当省略时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

通常按需计费的队列，在空闲1h后计算资源会被释放，再次使用时，需要重新分配计算资源，可能会耗费5~10min时间。按需计费以小时为单位进行结算。不足一小时按一小时计费，小时数按整点计算。例如 12:10 ~12:30、12:10 ~12:55 期间使用，则收取1个小时的费用。具体的计费模式请参考：计费说明。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
DLI弹性资源池与队列简介 - 数据湖探索 DLI

相关操作。建议使用自建队列执行生产作业。使用方法：default队列仅适用于提交SQL作业，在DLI管理控制台提交SQL作业时选择"default队列"即可。非弹性资源池模式（废弃，不推荐使用）： DLI的上一代计算资源管理方式，因缺乏灵活性，目前已不推荐使用。非弹性资源池

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
DLI SDK功能矩阵 - 数据湖探索 DLI

SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询指定资源包、删除资源包的Java SDK使用说明。 SQL作业相关介绍数据库相关、表相关、作业相关Java SDK使用说明。

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

expression) 默认情况下或使用关键字 ALL，返回所有输入行中表达式的最大值。使用 DISTINCT 则对所有值去重后计算。 MIN([ ALL | DISTINCT ] expression ) 默认情况下或使用关键字 ALL，返回所有输入行中表达式的最小值。使用 DISTINCT 则对所有值去重后计算。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
程序包管理概述 - 数据湖探索 DLI

程序包管理概述在执行DLI作业前需要将UDF Jar包或Jar作业程序包上传到云平台进行统一的管理和维护。有以下两种方式管理程序包：（推荐使用）上传至OBS管理程序包：提前将对应的jar包上传至OBS桶中，在作业配置时选择对应的OBS路径。（DLI程序包功能即将停用）上传至DL

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI Lakehouse表。使用Hive语法创建OBS表 defalut方言： with

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
数学运算函数 - 数据湖探索 DLI

若值不等于子查询返回的每个值，则返回TRUE。注意事项 double、real和float值存在一定的精度差。且我们不建议直接使用等号“=”对两个double类型数据进行比较。用户可以使用两个double类型相减，而后取绝对值的方式判断。当绝对值足够小时，认为两个double数值相等，例如: abs(0

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

连接。操作流程图1 配置DLI队列访问公网流程步骤1：创建VPC 登录虚拟私有云控制台，创建虚拟私有云。创建的VPC供NAT访问公网使用。创建VPC的具体操作请参考创建虚拟私有云。图2 创建VPC 步骤2：创建弹性资源池和队列登录DLI管理控制台。在左侧导航栏单击“资源管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

基于以上场景，DLI提供了队列弹性扩缩容定时任务功能。用户可以根据自己的业务周期或者使用情况，基于现有队列规格，在不同的时间或者周期内设置不同的队列大小，以满足自己的业务需求，节约成本。本节操作仅适用于普通队列，不适用于弹性资源池队列。使用弹性扩缩容定时任务注意事项新创建的队列需要运行作业后才可进行扩缩容。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

样方法要么从特定数据段中选择所有行，要么跳过它（基于采样百分比与运行时计算的随机值之间的比较）。系统采样中行的选择依赖于使用的connector。例如，如果使用Hive数据源，这将取决于数据在OBS上的布局。这种采样方法不能保证独立的抽样概率。 SELECT * FROM users

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

初步认识华为云数据湖探索，了解数据湖探索的基本功能、应用场景、基本概念和使用限制，有助于您更准确地匹配实际业务。产品介绍什么是DLI 应用场景使用限制与其他云服务的关系 03 入门购买DLI队列后，您可以运行SQL作业和Spark作业，开启您的数据湖探索使用之旅。使用前须知准备工作权限管理入门操作指导

 帮助中心 > 数据湖探索 DLI > 成长地图
DWS Connector概述 - 数据湖探索 DLI

写逻辑。 DLI提供的DWS Connector使用方法请参考表1 表1 DWS Connector支持类别类别操作指导源表 DWS源表（不推荐使用）结果表 DWS结果表（不推荐使用）维表 DWS维表（不推荐使用）父主题： DWS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
（推荐）DLI SDK V3 - 数据湖探索 DLI

v3 Java SDK使用指导 Java SDK视频指导 Python huaweicloud-sdk-python-v3 Python SDK使用指导 Python SDK视频指导 PHP huaweicloud-sdk-php-v3 PHP SDK使用指导 PHP SDK视频指导

 帮助中心 > 数据湖探索 DLI > SDK参考
为什么在DLI控制台中查询不到表？ - 数据湖探索 DLI

录的用户没有对该表的查询和操作权限。解决措施联系创建该表的用户，让该用户给需要操作该表的其他用户赋予查询和操作的权限。赋权操作如下：使用创建表的用户账号登录到DLI管理控制台，选择“数据管理 > 库表管理”。单击对应的数据库名称，进入到表管理界面。在对应表的“操作”列，单击“权限管理”，进入到表权限管理界面。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

的数据量。弹性资源池的实际CUs、已使用CUs、CU范围、规格（包周期CU）实际CUs：弹性资源池当前分配的可用CUs。已使用CUs：已经被作业或任务占用的CU资源。这些资源可能正在执行计算任务，暂时不可用。 HetuEngine已使用CUs和实际CU一致。 CU范围：CU

帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 990

上一页
1
...
37
38
39
...
50
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表初始化 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

监控安全风险 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

为什么在DLI控制台中查询不到表？ - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线