搜索_华为云

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

为了避免系统故障导致作业异常自动重启后，丢失数据：对于Flink SQL作业，您可以勾选“开启Checkpoint”，并合理配置Checkpoint间隔（权衡执行Checkpoint对业务性能的影响以及异常恢复的时长），同时勾选“异常自动重启”，并勾选“从Checkpoint恢复”。配置后，作业异常

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Spark 2.4.5版本说明 - 数据湖探索 DLI

Spark 2.4.5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
DLI数据库和表类 - 数据湖探索 DLI

overwrite覆盖分区表数据的时候，覆盖了全量数据？跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ SQL作业执行完成后，修改表名导致datasize不正确怎么办？从DLI导入数据到OBS，数据量不一致怎么办？

帮助中心 > 数据湖探索 DLI > 常见问题
EXPLAIN - 数据湖探索 DLI
EXPLAIN - 数据湖探索 DLI

type表示一个fragment如何被执行以及数据在不同fragment之间怎样分布。 SINGLE Fragment会在单个节点上执行。 HASH Fragment会在固定数量的节点上执行，输入数据通过哈希函数进行分布。 ROUND_ROBIN Fragment会在固定数量的节点上执行，片段在固定数量

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
怎样查看DLI的数据扫描量？ - 数据湖探索 DLI

怎样查看DLI的数据扫描量？登录DLI管理控制台。选择“作业管理 > SQL作业”。筛选执行队列为default队列，查看相应的作业。单击展开作业，查看已扫描的数据。如图1所示。图1 查看作业扫描量父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。Flink Sink写Kafka报错后作业失败： Caused by: org.apache.kafka.common.errors.NetworkException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
CREATE FUNCTION语句 - 数据湖探索 DLI

若该函数已经存在，则不会进行任何操作。 LANGUAGE JAVA|SCALA Language tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA 和 SCALA，且函数的默认语言为 JAVA。示例创建一个名为STRINGBACK的函数 create

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

只支持csv格式。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。提交作业 DLI提供查询作业的接口。您可以使用该接口执行查询并获取查询结果。示例代码如下： 1 2 3 4

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。

帮助中心 > 数据湖探索 DLI > 快速入门
查看弹性资源池的基本信息 - 数据湖探索 DLI

查看弹性资源池的基本信息资源池创建完成后您可以通过管理控制台查看和管理您的弹性资源池。本节操作介绍在管理控制台如何查看弹性资源池基本信息，包括弹性资源池的VPC网段、IPv6网段、创建时间等信息。查看弹性资源池的基本信息登录DLI管理控制台。选择“资源管理 > 弹性资源池”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。执行SQL作业请选择SQL队列。执行Flink或Spark作业请选择通用队列。 _ 执行引擎 SQL队列可以选择队列引擎为Spark或者HetuEngine。 _ 企业项目选择对应的企业项目。

帮助中心 > 数据湖探索 DLI > 快速入门
DROP SCHEMA - 数据湖探索 DLI
DROP SCHEMA - 数据湖探索 DLI

EXISTS] databasename [RESTRICT|CASCADE] 描述从Catalog中删除指定的数据库，如果数据库中包含表，则必须在执行DROP DATABASE之前删除这些表，或者使用CASCADE模式。 DATABASE和SCHEMA在概念上是等价可互换的。 [IF EXISTS]

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

主题的元数据时超时了。此时您需要先检查Flink作业和Kafka的网络连通性，确保执行Flink作业所在的队列可以访问Kafka所在的VPC网络。若果网络不可达，请先配置网络连通后再重新执行作业。操作方法请参考测试地址连通性。配置详情请参考配置网络连通。父主题： Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
停止计费 - 数据湖探索 DLI
停止计费 - 数据湖探索 DLI

按需计费的数据存储仅在存储DLI表时计费，若不再使用这些资源且需停止计费，请删除相应资源。按需计费的扫描量仅在使用default队列执行作业时候按扫描量计费，作业执行完成后停止计费。按需计费资源删除后，可能还会存在账单信息，因为系统通常会在使用后1个小时内对上一个结算周期的费用进行扣款。例

 帮助中心 > 数据湖探索 DLI > 计费说明
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

约束限制当前使用SDK创建的作业不支持在default队列上运行。查询所有队列 DLI提供查询队列列表接口，您可以使用该接口并选择相应的队列来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 def list_all_queues(dli_client): try:

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
创建DLI自定义委托权限 - 数据湖探索 DLI

创建DLI自定义委托权限使用Flink 1.15和Spark 3.3及以上版本的引擎执行作业时，当您所需的委托没有包含在DLI系统委托dli_management_agency时，您需要在IAM页面创建相关委托，并在作业配置中添加新建的委托信息。dli_management_a

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
设置多版本备份数据保留周期 - 数据湖探索 DLI

7天，您可以通过配置系统参数“dli.multi.version.retention.days”调整保留周期。保留周期外的多版本数据后续在执行insert overwrite或者truncate语句时会自动进行清理。在添加列或者修改分区表时，也可以设置表属性“dli.multi.version

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
比较函数和运算符 - 数据湖探索 DLI

BETWEEN min AND max Not between适用于值不在某个特定范围内。 null值不能出现在between操作中，如下两种执行结果都是Null： SELECT NULL BETWEEN 2 AND 4; -- null SELECT 2 BETWEEN NULL AND

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

profile文件图2 dbt_project.yml文件中配置的profile 验证配置执行以下命令测试DBT配置是否正确： dbt debug 执行项目作业测试通过后执行以下命令来执行您的数据模型。 dbt run 父主题：使用BI工具连接DLI分析数据

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据

总条数： 690

上一页
1
...
4
5
6
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

DLI数据库和表类 - 数据湖探索 DLI

EXPLAIN - 数据湖探索 DLI

怎样查看DLI的数据扫描量？ - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

DROP SCHEMA - 数据湖探索 DLI

Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

停止计费 - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

比较函数和运算符 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线