搜索_华为云

Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Spark作业开发类 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？父主题： Spark作业相类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
Upsert Kafka结果表 - 数据湖探索 DLI

connector类型，对于upsert kafka，需配置为'upsert-kafka'。 topic 是 (none) String Kafka topic名。 properties.bootstrap.servers 是 (none) String Kafka brokers地址，以逗号分隔。 key.format

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

获取委托的临时AKSK、Flink SQL UDF 获取委托的临时AKSK场景。请参考Flink作业委托场景开发指导。 Flink 1.15 Jar 读取用户自定义配置文件的方式相比Flink 1.12存在差异。详细操作说明请参考使用Flink Jar写入数据到OBS开发指南。 Flink 1.15 Jar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
创建消息通知主题 - 数据湖探索 DLI

如果选择“邮件”协议，需要在“订阅终端”中填写接收确认邮件的邮箱地址。更多信息，请参考《消息通知服务用户指南》中《添加订阅》章节。图4 添加订阅通过单击短信或者邮件中的链接确认后，将收到“订阅成功”的信息。在消息通知服务的“订阅”页面，对应的订阅状态为“已确认”，表示订阅成功。父主题：管理队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
实时任务接入 - 数据湖探索 DLI

//同步元数据方式为jdbc 'hive_sync.jdbc_url' = '', //同步元数据的jdbc url 'hive_sync.db' = 'default'

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Flink作业性能调优 - 数据湖探索 DLI

反压状态是通过周期性对taskManager线程的栈信息采样，计算被阻塞在请求输出Buffer的线程比率来确定，默认情况下，比率在0.1以下为OK，0.1到0.5为LOW，超过0.5则为HIGH。时延 Source端会周期性地发送带当前时间戳的LatencyMarker，下游算子接收到该标记后，通过当前时间减去

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

（import moduleA），那么其压缩包要求满足如下结构：图2 压缩包结构要求即在压缩包内有一层以模块名命名的文件夹，然后才是对应类的Python文件，通常下载下来的Python库可能不满足这个要求，因此需要重新压缩。同时对压缩包的名称没有要求，所以建议可以把多个模块的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Spark作业运维类 - 数据湖探索 DLI

verifyBucketExists on XXXX: status [403] Spark作业运行大批量数据时上报作业运行超时异常错误使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常执行作业的用户数据库和表权限不足导致作业运行失败为什么Spark3.x的作业日志中打印找不到global_temp数据库

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

huaweicloud.sdk.core.auth.ICredentialProvider接口的getCredentials()返回值中。返回类型为com.huaweicloud.sdk.core.auth.BasicCredentials。仅支持获取AK、SK、SecurityToken。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
原生数据类型 - 数据湖探索 DLI

有符号整数，存储空间为2字节，范围为-32768～32767。当为NULL情况下，采用计算值默认为0。 TINYINT 有符号整数，存储空间为1字节，范围为-128～127。当为NULL情况下，采用计算值默认为0。 BIGINT/LONG 有符号整数，存储空间为8字节，范围为-92233

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

分钟大小的滚动窗口下，时间戳为 2021-06-30 00:00:04 的数据会被分配到哪个窗口呢？当 offset 为 -16 MINUTE，数据会分配到窗口 [2021-06-29 23:54:00, 2021-06-30 00:04:00)。当 offset 为 -6 MINUTE，数据会分配到窗口

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
创建Bucket索引表调优 - 数据湖探索 DLI

理：持续大量新增数据的维度表方法一：预留桶数，如使用非分区表则需通过预估较长一段时间内的数据增量来预先增加桶数，缺点是随着数据的增长，文件依然会持续膨胀；方法二：大粒度分区（推荐），如果使用分区表则需要根据数据增长情况来计算，例如使用年分区，这种方式相对麻烦些但是多年后表无需重新导入。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
权限管理概述 - 数据湖探索 DLI

围。例如您的员工中有负责软件开发的人员，您希望他们拥有DLI的使用权限，但是不希望他们拥有删除DLI等高危操作的权限，那么您可以使用IAM为开发人员创建用户，通过授予仅能使用DLI，但是不允许删除DLI的权限策略，控制他们对DLI资源的使用范围。对于新建的用户，需要先登录一次DLI，记录元数据，后续才可正常使用。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
存储计费 - 数据湖探索 DLI
存储计费 - 数据湖探索 DLI

4/18 11:45:46删除队列和DLI表：第一个计费周期为9:00:00 ~ 10:00:00，该计费周期内的计费时长为1小时。第二个计费周期为10:00:00 ~ 11:00:00，该计费周期内的计费时长为1小时。您需要为每个计费周期付费，计费公式如表2所示。表2 计费公式

 帮助中心 > 数据湖探索 DLI > 计费说明
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

为Flink作业的输入数据。前提条件自定义source类需要继承类RichParallelSourceFunction，并指定数据类型为Row。例如自定义类MySource：public class MySource extends RichParallelSourceFu

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
队列相关API（推荐） - 数据湖探索 DLI

队列相关API（推荐）创建队列删除队列查询所有队列查询队列详情重启/扩容/缩容队列创建指定地址连通性测试请求查询指定地址连通性测试详情

 帮助中心 > 数据湖探索 DLI > API参考
删除组内资源包（废弃） - 数据湖探索 DLI

带入query参数的URL示例如下： DELETE /v2.0/{project_id}/resources/{resource_name}?group={group} 请求消息无请求参数。响应消息删除成功，返回码为200 删除不存在的资源包，返回码为404 请求示例无响应示例

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

围。例如您的员工中有负责软件开发的人员，您希望他们拥有DLI的使用权限，但是不希望他们拥有删除DLI等高危操作的权限，那么您可以使用IAM为开发人员创建用户，通过授予仅能使用DLI，但是不允许删除DLI的权限策略，控制他们对DLI资源的使用范围。如果账号已经能满足您的需求，不需

 帮助中心 > 数据湖探索 DLI > 产品介绍
Flink 1.12版本说明 - 数据湖探索 DLI

CDC源表、Postgres CDC源表、Redis源表、Upsert Kafka源表、Hbase源表。 Flink 1.12新增支持小文件合并功能。 Flink 1.12新增支持Redis维表、RDS维表。父主题：版本支持公告

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告

总条数： 545

上一页
1
...
23
24
25
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

创建消息通知主题 - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

Spark作业运维类 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

原生数据类型 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

存储计费 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

队列相关API（推荐） - 数据湖探索 DLI

删除组内资源包（废弃） - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

Flink 1.12版本说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线