搜索_华为云

Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建表（废弃） - 数据湖探索 DLI

表示该列是否为分区列。“true”表示为分区列，“false”为非分区列，默认为“false”。说明：创建分区表时，需要保证表中至少有一列为非分区列。详见“请求样例”。响应消息表5 响应参数参数名称是否必选参数类型说明 is_success 否 Boolean 执

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
SHOW语法使用概要 - 数据湖探索 DLI

可以用来匹配0个或者任意个任意字符。规则4：|可以用来配置多种规则，规则之间用“|”分隔。规则5：当想将“_”作为匹配条件时，可以使用ESCAPE 指定一个转义字符，对“_”进行转义，以免按照规则1对“_”进行解析。父主题： DDL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
数据类型介绍 - 数据湖探索 DLI

ap，struct。其余的类型在数据查询和运算时支持。通常情况下，大部分非复合数据类型都可以通过字面量加字符串的方式来输入，示例为添加了一个json格式的字符串： select json '{"name": "aa", "sex": "man"}';

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
Spark作业开发类 - 数据湖探索 DLI

partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？父主题： Spark作业相类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
Lambda 表达式 - 数据湖探索 DLI
Lambda 表达式 - 数据湖探索 DLI

[3, 4] | 4 | 2 | [14, 18] (2 rows) 通过any_match()过滤出至少有一个元素值大于100的数组： SELECT numbers FROM (VALUES (ARRAY[1,NULL,3]), (ARRAY[10

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

群所属的企业项目必须相同，如果不同，需要修改工作空间的企业项目。本示例CDM集群的虚拟私有云、子网以及安全组和创建的MRS集群保持一致。步骤一：数据准备 MRS集群上创建Kafka的Topic并且向Topic发送消息。参考访问MRS Manager登录MRS Manager。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
管理DLI全局变量 - 数据湖探索 DLI

删除，保证同账号同项目下唯一，此时具备该全局变量修改权限的用户均可以修改对应的变量值。删除全局变量在“全局变量”页面，单击变量“操作”列中的“删除”，可删除对应的变量。如果同账号同项目下存在多个相同名称的全局变量，优先删除用户自建的。如果仅存在唯一名称的全局变量，则具备删除权限即的用户均可删除该全局变量。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
attr - 数据湖探索 DLI
attr - 数据湖探索 DLI

user_define_func 用户自定义函数。 general_binary_operator 普通二元操作符。 general_unary_operator 普通一元操作符。 ( 指定子属性表达式开始。 ) 指定子属性表达式结束。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
DLI产品咨询类 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 DLI的数据可存储在哪些地方 DLI是否支持导入其他租户共享OBS桶的数据？区域和可用区全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量怎样获取DLI作业样例（Demo） DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？

帮助中心 > 数据湖探索 DLI > 常见问题
逻辑运算符 - 数据湖探索 DLI
逻辑运算符 - 数据湖探索 DLI

逻辑运算符逻辑运算符操作描述例子 AND 两个值都为true，则为true a AND b OR 两个值其中一个为true，则为true a OR b NOT 值为false，结果则为true NOT a 以下真值表反映了AND和OR如何处理NULL值： a b a AND

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Spark SQL常用配置项说明 - 数据湖探索 DLI

dynamicPartitionOverwrite.enabled false 当前配置设置为“false”时，DLI在覆盖写之前，会删除所有符合条件的分区。例如，分区表中有一个“2021-01”的分区，当使用INSERT OVERWRITE语句向表中写入“2021-02”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
SQL作业运行慢如何定位 - 数据湖探索 DLI

GC”关键字，查看日志中是否有时间连续，并且频繁出现“Full GC”的日志信息。图5 Full GC日志 FullGC问题原因定位和解决：原因1 小文件过多：当一个表中的小文件过多时，可能会造成Driver内存FullGC。登录DLI控制台，选择SQL编辑器，在SQL编辑器页面选择问题作业的队列和数据库。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
类型转换函数 - 数据湖探索 DLI

| TYPEOF(input, force_serializable) 返回输入表达式的数据类型的字符串表示形式。默认情况下返回的字符串是一个摘要字符串，可能会为了可读性而省略某些细节。如果 force_serializable 设置为 TRUE，则字符串表示可以保留在目录中的完整数据类型。请注意，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
获取跨源认证列表（废弃） - 数据湖探索 DLI

String 查询结果偏移量，默认为0（连接以创建时间进行排序）。 auth_info_name 是 String 认证信息名，同一个project下唯一。请求参数无响应参数表3 响应参数参数参数类型说明 is_success Boolean 请求执行是否成功。“true”表示请求执行成功。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
获取跨源认证列表 - 数据湖探索 DLI

String 查询结果偏移量，默认为0（连接以创建时间进行排序）。 auth_info_name 是 String 认证信息名，同一个project下唯一。请求参数无响应参数表3 响应参数参数参数类型说明 is_success Boolean 请求执行是否成功。“true”表示请求执行成功。

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

strict模式，Insert 语句将保留 COW 表的主键唯一性约束，不允许重复记录。如果在插入过程中已经存在记录，则会为COW表执行 HoodieDuplicateKeyException；对于MOR表，该模式与upsert模式行为一致。 non-strict模式，对主键表采用insert处理。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

会校验该数据库在metastore是否存在，如果该数据库存在则会导致Spark作业执行失败。因此当Spark3.x的作业日志中如果出现一条访问catalog查询该数据库，并提示数据库不存在是为了确保Spark作业正常运行，无需执行其他操作。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

当前仅适用于在默认default队列中提交作业按扫描数据量计费。 CU是弹性资源池的计价单位。 1CU= 1Core 4GMem。不同规格对应的计算能力不一样，规格越高计算能力越好。 default队列中提交作业按扫描数据量计费。计费模式 DLI在不同的计费项下有不同的计费模式，具体详见表2说明。

帮助中心 > 数据湖探索 DLI > 计费说明
userDefined结果表 - 数据湖探索 DLI

throws Exception {} @Override //业务数据处理逻辑具体实现 /*in包括两个值，其中第一个值为布尔型，为true或false，当true时表示插入或更新操作，为false时表示删除操作，若对接的sink端不支持删除等操作，当为f

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 713

上一页
1
...
28
29
30
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

SHOW语法使用概要 - 数据湖探索 DLI

数据类型介绍 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

Lambda 表达式 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

attr - 数据湖探索 DLI

DLI产品咨询类 - 数据湖探索 DLI

逻辑运算符 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

获取跨源认证列表（废弃） - 数据湖探索 DLI

获取跨源认证列表 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线