搜索_华为云

插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

插入数据功能描述将SELECT查询结果或某条数据插入到表中。约束限制 insert overwrite语法不适用于“自读自写”场景，该场景因涉及数据的连续处理和更新，如果使用insert overwrite语法可能存在数据丢失风险。 "自读自写"是指在处理数据时能够读取数据，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
查询作业详情 - 数据湖探索 DLI

查询作业详情功能介绍查看一个作业的详情信息。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id}/streaming/jobs/{job_id} 参数说明表1 URI参数说明参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

cume_dist cume_dist函数用于求累计分布，相当于求分区中大于等于或小于等于当前行的数据在分区中的占比。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 分析窗口函数
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

Hbase结果表功能描述 DLI将作业的输出数据输出到HBase中。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南概述本节操作介绍基于Flink 1.12版本的Flink Jar作业读写DIS数据的操作方法。 Flink 1.12版本Flink Opensource SQL作业不支持使用DLI提供的connector读写DIS，因此推荐您使用本节操作提供的方法

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移MRS Kafka数据至DLI。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI队列时队列类型需要选择为“SQL队列”。已创建包含Kafka组件的MRS

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

插入数据功能描述将SELECT查询结果或某条数据插入到表中。约束限制 insert overwrite语法不适用于“自读自写”场景，该场景因涉及数据的连续处理和更新，如果使用insert overwrite语法可能存在数据丢失风险。 "自读自写"是指在处理数据时能够读取数据，

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
迁移Kafka数据至DLI - 数据湖探索 DLI

迁移Kafka数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移MRS Kafka数据至DLI。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI队列时队列类型需要选择为“SQL队列”。已创建包含Kafka组件的MRS安全集群。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据迁移
创建队列定时扩缩容计划（废弃） - 数据湖探索 DLI

创建队列定时扩缩容计划（废弃）功能介绍该API用于创建队列定时扩缩容计划，对指定的队列创建定时规格变更计划。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1/{project_id}/queues/{queue_name

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
永洪BI添加数据源 - 数据湖探索 DLI

永洪BI添加数据源操作场景在永洪SaaS生产环境中添加DLI的数据源。操作步骤在永洪SaaS生产环境主页，单击左侧导航栏中的“添加数据源”，请参见图1。图1 添加数据源 “选择数据源类型”页面中，新建数据源类型选择“GENERIC”。请参见图2。图2 选择数据源类型添加数据源的相关配置

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析 > 永洪BI对接DLI提交Spark作业
Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch结果表功能描述 DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch结果表功能描述 DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
get_json_object - 数据湖探索 DLI
get_json_object - 数据湖探索 DLI

get_json_object get_json_object函数用于根据所给路径对json对象进行解析，当json对象非法时将返回NULL。命令格式 get_json_object(string <json>, string <path>) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 字符串函数
修改队列定时扩缩容计划（废弃） - 数据湖探索 DLI

修改队列定时扩缩容计划（废弃）功能介绍该API用于修改指定ID的队列的定时扩缩容计划。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： PUT /v1/{project_id}/queues/{queue_name}/plans

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
get_json_object - 数据湖探索 DLI
get_json_object - 数据湖探索 DLI

get_json_object get_json_object函数用于根据所给路径对json对象进行解析，当json对象非法时将返回NULL。命令格式 get_json_object(string <json>, string <path>) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，性能较好

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业本章节主要介绍从创建弹性资源池、创建增强型跨源、添加队列到弹性资源池并运行作业的一个完整流程，帮助您更好、更方便的使用弹性资源池。图1 创建弹性资源池运行作业流程图表1 创建新队列时绑定弹性资源池流程说明阶段说明参考文档步骤一：创建弹性资源池

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接功能介绍该API用于创建与其他服务的增强型跨源连接。如果需要了解Console界面的使用方法，可参考《数据湖探索用户指南》中的“增强型跨源连接”。系统default队列不支持创建跨源连接。调试您可以在API Explorer中调试该接口。 URI URI

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据场景描述 DLI可以查询存储在OBS中的数据，本节操作介绍使用DLI提交SQL作业查询OBS数据的操作步骤。本例新建“sampledata.csv”文件上传OBS桶，并新建弹性资源池队列，使用DLI创建数据库和表，使用DLI提供的SQL编辑器查询表的

 帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 549

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

插入数据 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

cume - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

迁移Kafka数据至DLI - 数据湖探索 DLI

创建队列定时扩缩容计划（废弃） - 数据湖探索 DLI

永洪BI添加数据源 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

get_json_object - 数据湖探索 DLI

修改队列定时扩缩容计划（废弃） - 数据湖探索 DLI

get_json_object - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线