搜索_华为云

查询经典型跨源连接 - 数据湖探索 DLI

用于建立跨源关联表时，需要使用到的连接url。 cluster_name 否 String Serverless Spark队列名称。SQL队列模式下建立的跨源连接，该字段为空。 service 否 String 创建连接时，用户指定的对端服务（CloudTable/CloudTable.OpenTSDB/MRS

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
区域和可用区 - 数据湖探索 DLI

据需求选择适合自己的区域和可用区。更多信息请参见华为云全球站点。如何选择区域？选择区域时，您需要考虑以下几个因素：地理位置一般情况下，建议就近选择靠近您或者您的目标用户的区域，这样可以减少网络时延，提高访问速度。不过，在基础设施、BGP网络品质、资源的操作与配置等方面，中

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Json函数和运算符 - 数据湖探索 DLI

在从JSON转换为ROW时，支持JSON数组和JSON对象。 JSON数组可以具有混合元素类型，JSON Map可以有混合值类型。这使得在某些情况下无法将其转换为SQL数组和Map。为了解决该问题，HetuEngine支持对数组和Map进行部分转换： SELECT CAST(JSON'[[1

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建弹性资源池 - 数据湖探索 DLI

u 标准版：最小值为64CUs 基础版：最小值为16CUs，最大值为64CUs min_cu 是 Integer 最小CU大于等于该资源池下所有队列最小CU之和，最小值为64。标准版：最小值为64CUs 基础版：最小值为16CUs，最大值为64CUs charging_mode

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

----|--------------z 1 | {a=1, b=HetuEngine} --字段是支持命名的，默认情况下，Row的字段是未命名的 select row(1,2e0),CAST(ROW(1, 2e0) AS ROW(x BIGINT, y DOUBLE));

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
开启Flink作业动态扩缩容 - 数据湖探索 DLI

SQL作业和Flink Jar作业。登录DLI管理控制台。单击“作业管理 > Flink作业”。选择要开启动态扩缩容的作业，单击操作列下的编辑。 Flink Opensource SQL作业单击“自定义配置”，配置动态扩缩容参数。 Flink Jar作业单击“优化参数”框，配置动态扩缩容参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

示跨源已经绑定成功，否则表示未成功。登录RDS MySQL，并使用下述命令在flink库下创建orders表，并插入数据。创建数据库的操作可以参考创建RDS数据库。在flink数据库库下创建orders表： CREATE TABLE `flink`.`orders` ( `order_id`

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
ClickHouse结果表 - 数据湖探索 DLI

flink ON CLUSTER default_cluster; 使用以下命令在default_cluster集群节点上和flink数据库下创建表名为order的ReplicatedMergeTree表。 CREATE TABLE flink.order ON CLUSTER d

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

println(messageInfo.getMsg()); } 查询所有批处理作业 DLI提供查询批处理作业的接口。您可以使用该接口查询当前工程下的所有批处理作业信息。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 private

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

(1 row) -- 查询web schema下的page_views表扩展信息 show table extended from web like 'page*';

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

如果为false，则表示输出数据到taskmanager的out中。 sink.parallelism 否无 Integer 为Print结果表定义并行度。默认情况下，并行度由框架决定，与上游并行度一致。示例参考创建Flink OpenSource作业，创建flink opensource sql作业

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Postgres CDC源表 - 数据湖探索 DLI

在PostgreSQL中创建数据库flink，并创建名为test的schema。在PostgreSQL中flink数据库的test schema下创建表名为cdc_order的表，SQL语句参考如下： create table test.cdc_order( order_id VARCHAR

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

TIMESTAMP_LTZ(3)。在流模式下为每条记录进行取值。但在批处理模式下，它在查询开始时计算一次，并对每一行使用相同的结果。 LOCALTIME TIME 返回本地时区的当前 SQL 时间，返回类型为 TIME(0)。在流模式下为每条记录进行取值。但在批处理模式下，它在查询开始时计算一次，并对每一行使用相同的结果。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Hudi表模型设计规范 - 数据湖探索 DLI

流式计算为低时延的实时计算，需要高性能的流式读写能力，在Hudi表中存在的MOR和COW两种模型中，MOR表的流式读写性能相对较好，因此在流式计算场景下采用MOR表模型。关于MOR表在读写性能的对比关系如下：对比维度 MOR表 COW表流式写高低流式读高低批量写高低批量读

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

支持将 Debezium JSON解析为 INSERT / UPDATE / DELETE 消息到 Flink SQL 系统中。在很多情况下，利用这个特性非常的有用，例如将增量数据从数据库同步到其他系统日志审计数据库的实时物化视图关联维度数据库的变更历史，等等。参数说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。同步数据库数据的客户端，都会有一个唯一ID，即Server ID。同一个数据库下，建议每个MySQL CDC作业配置不同的Server ID。主要原因如下： MySQL SERVER会根据该ID来维护网络连接以及Bin

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间 Parquet还支持灵活的压缩选项，因此可以显著减少磁盘上的存储。存储的节省可高达约75%。资源和成本规划

 帮助中心 > 数据湖探索 DLI > 最佳实践
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

置，即每月1日0点重置免费资源。 DLI的套餐包中仅存储套餐包按自然周期重置，即每小时重置，其他套餐包按订购周期重置。适用场景通常情况下，建议您针对不同的业务创建项目：开发项目：在此项目下，大多是工程师开发调试时使用，作业随机性大，数据量小。针对这种情况，建议您使用按CU时

 帮助中心 > 数据湖探索 DLI > 计费说明
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

剩余的CU数分配完成。队列扩容成功后，系统开始对扩容的CU进行计费，直到缩容成功停止对扩容的CU计费。因此，要注意如果业务没有需求的情况下，要及时清理释放资源，否则不管CU是否真正的使用，都会一直计费。表1 弹性资源池扩缩容CU分配场景说明（无任务场景）场景弹性资源池CU数分配说明

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池

总条数： 440

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询经典型跨源连接 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

创建弹性资源池 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

Print - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线