搜索_华为云

Spark开源命令支持说明 - 数据湖探索 DLI

Spark开源命令支持说明本章节介绍了目前DLI对开源的Spark SQL语法的支持情况。详细的语法、参数说明，示例等信息请参考Spark官方文档。表1 DLI Spark开源命令支持说明功能描述语法示例 DLI Spark 2.4.5 DLI Spark 3.3.1 创建数据库

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
userDefined结果表 - 数据湖探索 DLI

userDefined结果表功能描述您可通过编写代码实现将DLI处理之后的数据写入到指定的云生态或者开源生态。前提条件已编写代码实现自定义sink类：自定义sink类需要继承Flink开源类：RichSinkFunction，并指定数据类型为：Tuple2<Boolean, Row>。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

仅支持YARN集群。上下游数据连接除了开源connector之外，还提供开箱即用的connector，包括数据库（RDS、GaussDB）、消息队列（DMS）、数据仓库（DWS）、对象存储（OBS）相比开源connector有较多易用性和稳定性提升。仅提供开源connector。开发与运维

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

userDefined源表功能描述您可通过编写代码实现从云生态或者开源生态获取数据，再把获取到的数据作为Flink作业的输入数据。前提条件自定义source类需要继承类RichParallelSourceFunction，并指定数据类型为Row。例如自定义类MySource：public

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Flink 1.12版本说明 - 数据湖探索 DLI

Flink 1.12版本说明数据湖探索（DLI）遵循开源Flink计算引擎的发布一致性。本文介绍Flink 1.12版本所做的变更说明。更多Flink 1.12版本说明请参考Release Notes - Flink 1.12。 Flink 1.12版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Spark 3.3.1版本说明 - 数据湖探索 DLI

Spark 3.3.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.3.1版本所做的变更说明。更多Spark 3.3.1版本说明请参考Spark Release Notes。 Spark 3.3.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Flink 1.15版本说明 - 数据湖探索 DLI

Flink 1.15版本说明数据湖探索（DLI）遵循开源Flink计算引擎的发布一致性。本文介绍Flink 1.15版本所做的变更说明。更多Flink 1.15版本说明请参考Release Notes - Flink Jar 1.15、Flink OpenSource SQL1

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Spark 3.1.1版本说明 - 数据湖探索 DLI

Spark 3.1.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.1.1版本所做的变更说明。更多Spark 3.1.1版本说明请参考Spark Release Notes。 Spark 3.1.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
资产识别与管理 - 数据湖探索 DLI

资产识别与管理 DLI 可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据操作场景 DLI完全兼容开源的Apache Spark，支持用户开发应用程序代码来进行作业数据的导入、查询以及分析处理。本示例从编写Spark程序代码读取和查询OBS数据、编译打包到提交Spark Jar作业等完整的操作步骤说明来帮助您在DLI上进行作业开发。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

Format 能读写 JSON 格式的数据。当前，JSON schema 是从 table schema 中自动推导而得的。更多具体使用可参考开源社区文档：JSON Format。支持的Connector Kafka Upsert Kafka Elasticsearch 参数说明表1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

Avro格式允许基于Avro schema 读取和写入Avro 数据。目前，Avro schema 从表schema 推导。更多具体使用可参考开源社区文档：Avro Format。支持的Connector Kafka Upsert Kafka FileSystem 参数说明表1 参数说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
流生态作业开发指引 - 数据湖探索 DLI

流生态系统基于Flink和Spark双引擎，完全兼容Flink/Storm/Spark开源社区版本接口，并且在此基础上做了特性增强和性能提升，为用户提供易用、低时延、高吞吐的数据湖探索。数据湖探索的流生态开发包括云服务生态、开源生态和自拓展生态：云服务生态 DLI服务在Stream SQL中支

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

Hudi源表功能描述 Flink SQL读取Hudi表数据。更多具体使用可参考开源社区文档：Hudi。注意事项建议Hudi作为Source表时设置限流 Hudi表作为Source表时，为防止数据上限超过流量峰值导致作业出现异常，建议设置限流（read.rate.limit），限流上限应该为业务上线压测的峰值。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Flink Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败 - 数据湖探索 DLI

SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败问题根因该问题属于开源设计缺陷。解决措施您可以尝试将retry_rejected修改为retry-rejected。父主题： Flink SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

Parquet Format 功能描述 Apache Parquet格式允许读写 Parquet 数据。更多具体使用可参考开源社区文档：Parquet Format。支持的Connector FileSystem 参数说明表1 参数说明参数是否必选默认值类型描述 format

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

DLI datasource v1表 DLI datasource v2表（以下简称V2表）：spark开源的Datasource表，建表/插入/truncate命令使用spark开源的command，表的数据路径为$tablepath/数据文件。图2 DLI datasource

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 AOM服务提供的Prometheus监控是一种全面对接开源Prometheus生态的监控解决方案。它支持多种类型的组件监控，提供预置监控大盘和全面托管的Prometheus服务，通过Prometheus监控来统一采集、存储和显示监控

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

Orc Format 功能描述 Apache Orc Format允许读写ORC数据。更多具体使用可参考开源社区文档：Orc Format。支持的Connector FileSystem 参数说明表1 参数说明参数是否必选默认值类型描述 format 是无 String

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

允许我们基于CSV schema 进行解析和生成CSV 数据。目前的CSV schema 是基于table schema 推导出来的。更多具体使用可参考开源社区文档：CSV Format。支持的Connector Kafka Upsert Kafka FileSystem 参数说明表1 参数说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format

总条数： 82

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark开源命令支持说明 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

Flink 1.12版本说明 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

Flink 1.15版本说明 - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

Flink Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线