搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的OpenTSDB和MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
初始化DLI客户端 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。可以通过set方式修改endpoint，即dliInfo.setServerEndpoint(endpoint)。父主题： Java SDK环境配置

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Flink作业性能调优 - 数据湖探索 DLI

Flink作业性能调优性能调优相关基本概念消费组积压消费组积压可通过topic最新数据offset减去该消费组已提交最大offset计算得出，说明的是该消费组当前待消费的数据总量。如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择“云服务监控

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
first - 数据湖探索 DLI
first - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。 frame_clause 否用于确定数据边界。返回值说明参数的数据类型。示例代码示例数据为便于理解函数的使用方法，本文

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
初始化DLI客户端 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。可以通过set方式修改endpoint，即dliInfo.setServerEndpoint(endpoint)。父主题： Python SDK环境配置

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
last - 数据湖探索 DLI
last - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。 frame_clause 否用于确定数据边界。返回值说明参数的数据类型。示例代码为便于理解函数的使用方法，本文为您提供源

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码操作场景本例提供使用Spark作业访问DWS数据源的pyspark样例代码。在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
EXPLAIN - 数据湖探索 DLI
EXPLAIN - 数据湖探索 DLI

者多个节点执行。Fragments separation表示数据在两个节点之间进行交换。Fragment type表示一个fragment如何被执行以及数据在不同fragment之间怎样分布。 SINGLE Fragment会在单个节点上执行。 HASH Fragment会在固定

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
使用Hive语法创建OBS表 - 数据湖探索 DLI

提供毫秒级别访问时延，TB/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时会统计大小。添加数据时不会修改大小。如需查看表大小可以通过OBS查看。 CTAS建表语句不能指定表的属性。关于分区表的使用说明：创建分区表时，PARTITONED

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
lead - 数据湖探索 DLI
lead - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明参数的数据类型。示例代码示例数据为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示例。创建表logs，并添加数据，命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

DLI Hudi元数据 DLI Hudi元数据说明创建Hudi表时会在元数据仓创建表的相关元数据信息。 Hudi支持对接DLI元数据和Lakeformation元数据（仅Spark 3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
DLI Delta元数据 - 数据湖探索 DLI

DLI Delta元数据在DLI中提交Spark SQL作业开发Delta的SQL语法请参考Delta SQL语法参考。在DLI中提交Spark Jar作业开发Delta请参考在DLI使用Delta提交Spark Jar作业。 DLI Delta元数据说明创建Delta表时会在元数据仓创建表的相关元数据信息。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明参数的数据类型。示例代码示例数据为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示例。创建表logs，并添加数据，命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

单击可复制对应的语句。运行时长作业的运行时长。创建时间每个作业的创建时间，可按创建时间顺序或倒序显示作业列表。操作编辑：重新编辑修改该作业。终止：当作业状态在“提交中”和“运行中”时，“终止”按钮才生效。当作业状态为“已成功”、“已失败”、“已取消”的作业不能终止。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

计费概述数据湖探索DLI的计费由不同的计费项组成，不同的计费项有不同的计费模式，如图1所示。图1 DLI的计费组成计费项 DLI的计费项包括计算计费、存储计费、扫描量计费。DLI的计费详情请参见DLI产品价格详情。您可以通过DLI提供的价格计算器，快速计算出购买资源的参考价格。

帮助中心 > 数据湖探索 DLI > 计费说明
Hudi数据表Compaction规范 - 数据湖探索 DLI

要求Compaction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何合理的设置这个周期，周期如果太短意味着Spark任务可能会空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis

总条数： 569

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

first - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

last - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

EXPLAIN - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

lead - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

DLI Delta元数据 - 数据湖探索 DLI

lag - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线