搜索_华为云

Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消息进行过滤，则可以考虑先实时接入生成offset，再truncate

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Map函数和运算符 - 数据湖探索 DLI

map() 描述：返回一个空的map。 select map();-- {} map(array(K), array(V)) -> map(K, V) 描述：根据给定的键值对数组，返回map。聚合函数中的map_agg()和multimap_agg()也同样能用于生成map。 SELECT

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Spark 2.4.5版本说明 - 数据湖探索 DLI

版本说明表1列举了Spark 2.4.5 版本主要的功能特性。更多版本新特性请参考Release Notes - Spark 2.4.5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

例如，在插入语句后添加“DISTRIBUTE BY 1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

testtable; 测试结果 result 25 DAYOFWEEK 功能描述计算当前日期是当前周的第几天（1 到 7之间的整数），以BIGINT类型返回。需要注意这里自然周的起点是星期天，即每周的第1天是星期天，第2天是星期一，依次类推。语法说明 BIGINT DAYOFWEEK(date)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI Lakehouse表。使用Hive语法创建OBS表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建Hive Catalog - 数据湖探索 DLI

Hive兼容表是以Hive兼容的方式存储的，他们的元数据和实际的数据都在分层存储中。因此，通过flink创建的与hive兼容的表，可以通过hive查询。 Hive通用表是特定于Flink的。当使用HiveCatalog创建通用表时，只是使用HMS来持久化元数据。虽然这些表对Hive来说是可见的，但Hi

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Spark 3.3.1版本说明 - 数据湖探索 DLI

提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

作业管理参数参数参数说明作业ID 所提交Spark作业的ID，由系统默认生成。名称所提交Spark作业的名称。队列所提交Spark作业所在的队列。用户名执行Spark作业的用户名称。状态作业的状态信息，包括如下。启动中：正在启动运行中：正在执行任务已失败：session已退出

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

S表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建OBS的桶。具体OBS操作可以参考《对象存储服务用户指南》。本指导中的OBS桶名都为“dli-test-021”。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

testtable; 测试结果 result 25 DAYOFWEEK 功能描述计算当前日期是当前周的第几天（1 到 7之间的整数），以BIGINT类型返回。需要注意这里自然周的起点是星期天，即每周的第1天是星期天，第2天是星期一，依次类推。语法说明 BIGINT DAYOFWEEK(date)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

执行Checkpoint对业务性能的影响以及异常恢复的时长），同时勾选“异常自动重启”，并勾选“从Checkpoint恢复”。配置后，作业异常重启，会从最新成功的Checkpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

SQLUsername，它的值为用户的敏感信息。 'password' = 'MySQLPassword', -- DEW服务中，名称为secretInfo，且版本号v1的的通用凭证，定义凭证值的键MySQLPassword，它的值为用户的敏感信息。 'sink.buffer-flush

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
下载并安装JDBC驱动包 - 数据湖探索 DLI

本文介绍通过JDBC连接DLI并提交SQL作业。获取服务端连接地址连接DLI服务的地址格式为：jdbc:dli://<endPoint>/<projectId>。因此您需要获取对应的Endpoint和项目编号。在地区和终端节点获取DLI对应的Endpoint；在华为云页面上方菜单栏，单击用户名，然后在“我的凭证”页面获取项目编号。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

table-name、connector.key-column作为redis的key。redis的hash类型，每个key对应一个hashmap，hashmap的hashkey为源表的字段名，hashvalue为源表的字段值。 connector.use-internal-schema 否

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
创建DLI表关联DDS - 数据湖探索 DLI

authSource=admin" database DDS的数据库名，如果在"url"中同时指定了数据库名，则"url"中的数据库名不生效。 collection DDS中的collection名，如果在"url"中同时指定了collection，则"url"中的collection不生效。 user

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
自定义函数参数传递 - 数据湖探索 DLI

SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。操作步骤自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数

总条数： 196

上一页
1
...
5
6
7
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表初始化 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

Print - 数据湖探索 DLI

Map函数和运算符 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线