搜索_华为云

管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

量较多时，系统分页显示，您可以查看任何状态下的作业。表1 作业管理参数参数参数说明作业ID 所提交Spark作业的ID，由系统默认生成。名称所提交Spark作业的名称。队列所提交Spark作业所在的队列。用户名执行Spark作业的用户名称。状态作业的状态信息，包括如下。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

from testcsvdata2source; 图3 查询结果在OBS桶的“obs://dli-test-021/data”目录下刷新后查询，生成了csv数据文件，文件内容为insert插入的数据内容。图4 查询结果指定的OBS数据目录包含数据文件。在OBS桶“dli-test

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Spark 3.3.1版本说明 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

'datagen', 'rows-per-second' = '1', --每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

达到PB级。数据种类多，有结构化的遥感影像栅格数据、矢量数据，非结构化的空间位置数据、三维建模数据；在大体量的地理大数据中，通过高效的挖掘工具或者挖掘方法实现价值提炼，是用户非常关注的话题。优势提供地理专业算子：支持全栈Spark能力，具备丰富的Spark空间数据分析算法算子

 帮助中心 > 数据湖探索 DLI > 产品介绍
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

启“恢复保存点”，作业将从选择的savepoint文件中恢复消费位点及状态。同时，由于Flink Checkpoint和Savepoint生成机制及格式一致，因而，也可以通过Flink作业列表“操作”列中的“更多”>“导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建DLI表关联DDS - 数据湖探索 DLI

使用跨源密码认证时配置为“true”。如果在DDS中已存在collection，则建表可以不指定schema信息，DLI会根据collection中的数据自动生成schema信息。示例 1 2 3 4 5 6 create table 1_datasource_mongo.test_momgo(id

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

connector.key-column 否 table存储模式下可配置，将该字段值作为redis中的ext-key，未配置时，ext-key为生成的uuid。示例从Redis中读取数据。 create table redisSource( car_id STRING, car_owner

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

作业列表、查询作业详情、查询作业执行计划、查询作业监控信息、批量停止作业、删除作业、批量删除作业、导出Flink作业、导入Flink作业、生成Flink SQL作业的静态流图、创建IEF消息通道、边缘Flink作业状态上报、边缘Flink作业Action回调、IEF系统事件上报。

帮助中心 > 数据湖探索 DLI > API参考
自定义函数参数传递 - 数据湖探索 DLI

'datagen', 'rows-per-second' = '1', --每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

'datagen', 'rows-per-second' = '1', --每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from dli_to_dws").show(); 插入数据后：提交Spark作业将写好的代码文件生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spar

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

不生效。说明：如果在DDS中已存在collection，则建表可以不指定schema信息，DLI会根据collection中的数据自动生成schema信息。 user 访问DDS集群用户名。 password 访问DDS集群密码。图1 mongo的链接地址信息插入数据 sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sql("select * from opentsdb_new_test").show(); 插入数据后：提交Spark作业将写好的代码文件生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spar

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
提交SQL作业（废弃） - 数据湖探索 DLI

请求执行成功。 message 是 String 系统提示信息，执行成功时，信息可能为空。 job_id 是 String 此SQL语句将生成并提交一个新作业，返回此作业的ID，可用于获取作业状态和作业结果。 job_type 是 String 作业类型。 DDL DCL IMPORT

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Hudi常见配置参数 - 数据湖探索 DLI

次与基本文件合并，并生成压缩后要写入的最终记录。 org.apache.hudi.common.model.Defaulthoodierecordpayload hoodie.schedule.compact.only.inline 在写入操作时，是否只生成压缩计划。在hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
创建Flink Jar作业 - 数据湖探索 DLI

本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者Sbt构建工具中将scope设为provided 日志配置文件（例如：“log4j.properties”或者“logback.xml”等）日志输出实现类JAR包（例如：log4j等）

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

建议关闭在线压缩，提升性能。但是调度compaction.schedule.enabled仍然建议开启，之后可通过离线异步压缩，执行阶段性生成的压缩plan。 clean.async.enabled 否 true Boolean COW表：设置为true MOR表，且默认开启异步压缩时（compaction

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi

总条数： 212

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理Spark作业 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线