搜索_华为云

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

kpoint对业务性能的影响以及异常恢复的时长），同时勾选“异常自动重启”，并勾选“从Checkpoint恢复”。配置后，作业异常重启，会从最新成功的Checkpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
数据库相关 - 数据湖探索 DLI
数据库相关 - 数据湖探索 DLI

println("delete db " + dbName); } 含表的数据库不能直接删除，请先删除数据库的表再删除数据库。数据库删除后，将不可恢复，请谨慎操作。查询所有数据库 DLI提供查询数据库列表接口，您可以使用该接口查询当前已创建的数据库列表。示例代码如下： 1 2 3 4 5 6 7

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。产品介绍图说DLI 立即使用成长地图由浅入深，带您玩转DLI

帮助中心 > 数据湖探索 DLI > 成长地图
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

示例使用Kafka发送数据，通过JDBC结果表将Kafka数据再输出到MySQL数据库中。参考增强型跨源连接，在DLI上根据MySQL和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置MySQL和Kafka的安全组，添

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
数据相关 - 数据湖探索 DLI
数据相关 - 数据湖探索 DLI

数据相关导入数据插入数据清空数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
数据湖探索简介 - 数据湖探索 DLI

参考《数据湖探索开发指南》。数据治理中心DataArts Studio 数据治理中心DataArts Studio具有数据全生命周期管理、智能数据管理能力的一站式治理运营平台，支持行业知识库智能化建设，支持大数据存储、大数据计算分析引擎等数据底座，帮助企业快速构建从数据接入到数

 帮助中心 > 数据湖探索 DLI > 产品介绍
从Kafka读取数据写入到RDS - 数据湖探索 DLI

步骤3：创建RDS数据库和表登录RDS管理控制台，在“实例管理”界面，选择已创建的RDS MySQL实例，选择操作列的“更多 > 登录”，进入数据管理服务实例登录界面。输入实例登录的用户名和密码。单击“登录”，即可进入RDS MySQL数据库并进行管理。在数据库实例界面，单击

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Hudi数据表Compaction规范 - 数据湖探索 DLI

Flink写hudi建议的方案是Flink只负责写数据和生成Compaction计划。由单独的队列提交Spark SQL或Spark jar作业异步执行compaction、clean和archive。Compaction计划的生成是轻量级的对Flink写入作业影响可以忽略。上述方案落地的具体步骤参考如下：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

示例使用JDBC作为数据源，Print作为sink，从RDS MySQL数据库中读取数据，并写入到Print中。参考增强型跨源连接，根据RDS MySQL所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置RDS MySQL的安全组，添加入向规

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据订单信息使用kafka作为数据源表，JDBC作为数据结果表统计用户在30秒内的订单数量，并根据窗口的订单id和窗口开启时间作为主键，将结果实时统计到JDBC中：根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

会删除不带uuid分区路径下数据。升级引擎版本后是否对作业有影响：有影响，会清理脏数据。示例代码：准备数据： obs://bucket1/test/overwrite_datasource下创建pt=pt1目录，并导入一个parquet数据文件。 create table ove

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
查看指定数据库 - 数据湖探索 DLI

查看指定数据库功能描述查看指定数据库的相关信息，包括数据库名称、数据库的描述等。语法格式 1 DESCRIBE DATABASE [EXTENDED] db_name; 关键字 EXTENDED：除了显示上述信息外，还会额外显示数据库的属性信息。参数说明表1 参数说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

CURRENT_DATE DATE 以UTC时区返回当前SQL日期。 CURRENT_TIME TIME 以UTC时区返回当前SQL时间。 CURRENT_TIMESTAMP TIMESTAMP 以UTC时区返回当前SQL时间戳。 LOCALTIME TIME 返回当前时区的当前SQL时间。 LOCALTIMESTAMP

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
数据迁移与数据传输 - 数据湖探索 DLI

数据迁移与数据传输数据迁移与传输方式概述迁移外部数据源数据至DLI 配置DLI读写外部数据源数据

 帮助中心 > 数据湖探索 DLI > 用户指南
Spark表数据维护规范 - 数据湖探索 DLI

tblproperties('hoodie.index.type'='xx'); 除Spark以外，其他引擎也可以修改Hudi表元数据，但是这种修改会导致整个Hudi表出现数据重复，甚至数据损坏；因此禁止修改上述属性。父主题： Spark on Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
配置Hudi数据列默认值 - 数据湖探索 DLI

配置Hudi数据列默认值该特性允许用户在给表新增列时，设置列的默认值。查询历史数据时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

消费 // 取值有： LATEST,从最新的数据开始消费，此策略会忽略通道中已有数据 // EARLIEST,从最初的数据开始消费，此策略会获取通道中所有的有效数据 String offsetPolicy;

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

该场景下就需要使用REFRESH TABLE来解决该问题。REFRESH TABLE是用于重新整理某个分区的文件，重用之前的表元数据信息，能够检测到表的字段的增加或者减少，主要用于表中元数据未修改，表的数据修改的场景。语法格式 1 REFRESH TABLE [db_name.]table_name; 关键字

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
开启或关闭数据多版本 - 数据湖探索 DLI

开启或关闭数据多版本功能描述 DLI提供多版本功能，用于数据的备份与恢复。开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据。其他

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

IMPORT：导入数据到DLI的作业。 EXPORT：从DLI导出数据的作业。 DCL：包括传统DCL，以及队列权限相关的操作。 DDL：与传统DDL操作一致，即创建和删除数据库，创建和删除表的作业。 QUERY：执行SQL查询数据的作业。 INSERT：执行SQL插入数据的作业。 UPDATE：更新数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业

总条数： 1508

上一页
1
2
3
4
5
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

数据库相关 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

数据相关 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

查看指定数据库 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

数据迁移与数据传输 - 数据湖探索 DLI

Spark表数据维护规范 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线