搜索_华为云

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
删除视图 - 数据湖探索 DLI
删除视图 - 数据湖探索 DLI

删除视图功能描述删除视图。语法格式 1 DROP VIEW [IF EXISTS] [db_name.]view_name; 关键字 DROP：删除指定视图的元数据。虽然视图和表有很多共同之处，但是DROP TABLE不能用来删除VIEW。注意事项所要删除的视图必须是已经存在的，否则会出错，可以通过IF

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 视图相关
视图相关 - 数据湖探索 DLI
视图相关 - 数据湖探索 DLI

视图相关创建视图删除视图

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
CREATE VIEW语句 - 数据湖探索 DLI
CREATE VIEW语句 - 数据湖探索 DLI

CREATE VIEW语句语法定义 CREATE VIEW [IF NOT EXISTS] view_name [{columnName [, columnName ]* }] [COMMENT view_comment] AS query_expression 功能描述

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
Flink作业性能调优 - 数据湖探索 DLI

WHEN flag IN ('android', 'iphone')THEN user_id ELSE NULL END) AS app_uv 可调整为 COUNT(DISTINCT user_id) FILTER(WHERE flag IN ('android', 'iphone'))

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

的“自读自写”场景（包括分区表和非分区表），直接在原表上执行insert overwrite可能会导致数据丢失或数据不一致的风险。如果要实现“自读自写”场景数据操作，建议使用一个临时表来处理数据。如图1所示。 "自读自写"即目的表和数据源表都是同一张表。例如，假设将student表中class_no

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
创建视图 - 数据湖探索 DLI
创建视图 - 数据湖探索 DLI

创建视图功能描述创建视图。语法格式 1 CREATE [OR REPLACE] VIEW view_name AS select_statement; 关键字 CREATE VIEW：基于给定的select语句创建视图，不会将select语句的结果写入磁盘。 OR REP

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 视图相关
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

GROUPING SETS 功能描述 GROUPING SETS生成交叉表格行，可以实现GROUP BY字段的交叉统计。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
Hudi锁配置说明 - 数据湖探索 DLI

n提供的Hudi锁实现类。配置项配置值 hoodie.write.lock.provider org.apache.hudi.lakeformation.LakeCatMetastoreBasedLockProvider 关闭Hudi锁，或者使用其他的锁实现类时，存在数据丢失/异常的风险。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
创建Bucket索引表调优 - 数据湖探索 DLI

事实表通常整表数据规模较大，以新增数据为主，更新数据占比小，且更新数据大多落在近一段时间范围内（年或月或天），下游读取该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小，以更新数据为

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
userDefined结果表 - 数据湖探索 DLI

userDefined结果表功能描述您可通过编写代码实现将DLI处理之后的数据写入到指定的云生态或者开源生态。前提条件已编写代码实现自定义sink类：自定义sink类需要继承Flink开源类：RichSinkFunction，并指定数据类型为：Tuple2<Boolean

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
显示函数详情 - 数据湖探索 DLI

[EXTENDED] [db_name.] function_name; 关键字 EXTENDED：显示扩展使用信息。注意事项返回已有函数的元数据（实现类和用法），如果函数不存在，则系统报错。示例查看函数mergeBill的相关信息。 1 DESCRIBE FUNCTION mergeBill;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
最佳实践内容概览 - 数据湖探索 DLI

介绍内网环境打通DLI和外部数据源之间的网络的操作实践。配置DLI 队列与公网网络联通介绍通过配置SNAT规则，添加到公网的路由信息，实现队列到和公网的网络打通的实践方案。

帮助中心 > 数据湖探索 DLI > 最佳实践
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

创建一个Kafka源表，用来从Kafka指定Topic中读取消费数据；创建一个结果表，用来通过JDBC向MySQL中写入结果数据。实现相应的处理逻辑，以实现各个指标的统计。为了简化最终的处理逻辑，使用创建视图进行数据预处理。利用over窗口条件和过滤条件结合以去除重复数据（该方式是利用了top

帮助中心 > 数据湖探索 DLI > 最佳实践
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

Maxwell Format 功能描述 Flink 支持将 Maxwell JSON 消息解释为 INSERT/UPDATE/DELETE 消息到 Flink SQL 系统中。在许多情况下，这对于利用此功能很有用。例如：将数据库中的增量数据同步到其他系统审计日志数据库的实时物化视图

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

QL便可实现海量数据查询分析。SQL语法全兼容标准ANSI SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算资源按租户隔离，数据权限控制到队列、作业，帮助企业实现部门间的数据共享和权限管理。

帮助中心 > 数据湖探索 DLI > 产品介绍
使用HetuEngine on Hudi - 数据湖探索 DLI

使用HetuEngine on Hudi HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine对Hudi仅支持select操

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
数据湖探索成长地图 - 数据湖探索 DLI

通过DLI开放的API和调用示例，您可以使用并管理队列，SQL作业，Spark作业和跨源作业等。您还可以直接调用DLI SDK提供的接口函数实现业务。常用API API概览队列相关API Spark作业相关API 增强型跨源相关API 流作业相关API 流作业模板相关API SDK参考

 帮助中心 > 数据湖探索 DLI > 成长地图
为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

DLI增强型跨源连接创建对等连接的主要原因是为了实现DLI与不同VPC中的数据源之间的网络连通。当DLI需要访问外部数据源，而这些数据源位于不同的VPC中时，由于网络隔离，DLI默认无法直接读取这些数据源的数据。通过创建增强型跨源连接，可以采用对等连接的方式打通DLI与数据源的VPC网络，从而实现数据的互通和跨源分析。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。操作流程图1 配置DLI队列访问公网流程步骤1：创建VPC

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI读写外部数据源数据

总条数： 371

上一页
1
2
3
4
5
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消