搜索_华为云

去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

）则只保留最后一行。 WHERE rownum = 1: Flink 需要 rownum = 1 以确定该查询是否为去重查询。注意事项无示例根据order_id对数据进行去重，其中proctime为事件时间属性列 SELECT order_id, user, product, number

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

）则只保留最后一行。 WHERE rownum = 1: Flink 需要 rownum = 1 以确定该查询是否为去重查询。注意事项无示例根据order_id对数据进行去重，其中proctime为事件时间属性列 SELECT order_id, user, product, number

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
Color 函数 - 数据湖探索 DLI
Color 函数 - 数据湖探索 DLI

为用空格填充。 select bar(0.75,80,rgb(255,0,0),rgb(0,255,0)); render(b) 描述：根据布尔值返回对错符号。 select render(true),render(false); 父主题： SQL函数和操作符

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

）则只保留最后一行。 WHERE rownum = 1: Flink 需要 rownum = 1 以确定该查询是否为去重查询。注意事项无示例根据order_id对数据进行去重，其中proctime为事件时间属性列 SELECT order_id, user, product, number

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sql("select * from opentsdb_new_test").show(); 插入数据后：提交Spark作业将写好的代码文件生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spar

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
提交SQL作业（废弃） - 数据湖探索 DLI

请求执行成功。 message 是 String 系统提示信息，执行成功时，信息可能为空。 job_id 是 String 此SQL语句将生成并提交一个新作业，返回此作业的ID，可用于获取作业状态和作业结果。 job_type 是 String 作业类型。 DDL DCL IMPORT

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from dli_to_dws").show(); 插入数据后：提交Spark作业将写好的代码文件生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spar

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Confluent Avro Format - 数据湖探索 DLI

confluent avro的形式写入作为sink的topic中。根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
ALTER VIEW - 数据湖探索 DLI
ALTER VIEW - 数据湖探索 DLI

property_value, ...)。视图可以包含Limit和ORDER BY子句，如果关联视图的查询语句也包含了这类子句，则最后执行结果将根据视图的子句运算后得到。例如视图V指定了返回5条数据，而关联查询为select * from V limit 10，则最终只有5条数据返回。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

则”。设置行动规则名称、类型、行动方式等信息。详细参数说明请参考AOM-创建告警行动规则。当资源触发对应的告警条件时，系统根据关联SMN主题根据关联SMN主题与消息模板来发送告警通知。创建指标告警规则。通过指标告警规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
DWS Connector概述 - 数据湖探索 DLI

onnector-flink。（废弃，不推荐使用）DLI服务的DWS Connector：支持自定义sink和source函数，允许用户根据具体需求实现相应的sink或source函数，以实现特定的数据读写逻辑。 DLI提供的DWS Connector使用方法请参考表1 表1 DWS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
Flink作业性能调优 - 数据湖探索 DLI

延，确定算子的性能瓶颈点。作业最后一个算子(Sink)反压正常（绿色），前面算子反压高（红色）该场景说明性能瓶颈点在sink，此时需要根据具体数据源具体优化，比如对于JDBC数据源，可以通过调整写出批次(connector.write.flush.max-rows)、JDBC

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

emental_temp_view"); // 注册为spark临时表 // 结果必须根据startTime和endTime进行过滤，如果没有指定endTime，则只需要根据startTime进行过滤 spark.sql("select * from hudi_

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
预览表内容（废弃） - 数据湖探索 DLI

"xxx" ] ] } 如果为异步请求模式，则返回一个job ID，用户可再根据job ID获取预览信息。状态码状态码如表4所示。表4 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

在使用join进行多表关联查询时，不管表数据量大小，join时都需要指定on条件来减少多表关联的数据量，从而减轻队列的负荷，提升查询效率。例如，问题现象中的问题语句可以根据业务场景，在join时通过指定on条件来进行优化，这样会极大减少关联查询的结果集，提升查询效率。 select case

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

nk OpenSource SQL1.15语法概览。 Flink 1.15需要配置租户面自定义委托，并在作业中配置委托信息。委托的权限需要根据作业具体的业务场景需求进行配置。详情操作请参考DLI自定义委托。 Flink 1.15作业管理凭据的方法： Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

在OBS管理控制台左侧导航栏选择“对象存储”。在页面右上角单击“创建桶”，配置桶参数。区域：选择与DLI服务相同的区域桶名称：具体根据实际情况选择桶名，例如当前选择：obstest 默认存储类别：标准存储桶策略：私有默认加密：关闭归档数据直读：关闭企业项目：default

帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 596

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

去重 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

Color 函数 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

ALTER VIEW - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

预览表内容（废弃） - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线