搜索_华为云

使用DLI分析账单消费数据 - 数据湖探索 DLI

本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：步骤1：获取消费数据。获取账户的实际消费数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

System.out.println(messageInfo.getMsg()); } 查询所有批处理作业 DLI提供查询批处理作业的接口。您可以使用该接口查询当前工程下的所有批处理作业信息。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

的所有行。在没有ORDER BY的情况下，所有行都被视为对等行，因此未绑定的前导和当前行之间的范围等于未绑定的前导和未绑定的后续之间的范围。例如：下面的查询将salary表中的信息按照每个部门员工工资的大小进行排序。 --创建数据表并插入数据 create table salary

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

ROW_NUMBER(): 从第一行开始，依次为每一行分配一个唯一且连续的号码。 PARTITION BY col1[, col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
数据库相关 - 数据湖探索 DLI
数据库相关 - 数据湖探索 DLI

return 含表的数据库不能直接删除，请先删除数据库的表再删除数据库。数据库删除后，将不可恢复，请谨慎操作。完整样例代码和依赖包说明请参考：Python SDK概述。查询所有数据库 DLI提供查询数据库列表接口。您可以使用该接口查询当前已创建的数据库列表。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
OrderBy & Limit - 数据湖探索 DLI
OrderBy & Limit - 数据湖探索 DLI

对订单根据订单时间进行升序排序 SELECT * FROM Orders ORDER BY orderTime; Limit 功能描述限制返回的数据结果个数注意事项 LIMIT 查询需要有一个 ORDER BY 字句示例 SELECT * FROM Orders ORDER BY orderTime

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
创建弹性资源池并添加队列 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
OrderBy & Limit - 数据湖探索 DLI
OrderBy & Limit - 数据湖探索 DLI

对订单根据订单时间进行升序排序 SELECT * FROM Orders ORDER BY orderTime; Limit 功能描述限制返回的数据结果个数注意事项 LIMIT查询需要有一个ORDER BY 示例 SELECT * FROM Orders ORDER BY orderTime LIMIT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

ROW_NUMBER(): 从第一行开始，依次为每一行分配一个唯一且连续的号码。 PARTITION BY col1[, col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
Flink作业模板相关 - 数据湖探索 DLI

System.out.println(result); } 查询作业模板列表 DLI提供查询Flink作业模板的接口。您可以使用该接口查询作业模板列表。本示例排序方式选择降序desc，将会列出作业模板ID小于cursor的作业模板列表信息。示例代码如下： 1 2 3 4 5 6 7

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
alias - 数据湖探索 DLI
alias - 数据湖探索 DLI

alias 格式无。说明别名，可给字段、表、视图、子查询起别名，仅支持字符串类型。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
OrderBy & Limit - 数据湖探索 DLI
OrderBy & Limit - 数据湖探索 DLI

对订单根据订单时间进行升序排序 SELECT * FROM Orders ORDER BY orderTime; Limit 功能描述限制返回的数据结果个数注意事项 LIMIT 查询需要有一个 ORDER BY 字句示例 SELECT * FROM Orders ORDER BY orderTime

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

ROW_NUMBER(): 从第一行开始，依次为每一行分配一个唯一且连续的号码。 PARTITION BY col1[, col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
DLI弹性资源池与队列简介 - 数据湖探索 DLI

弹性资源池模式：计算资源的池化管理模式，提供计算资源的动态扩缩容能力，同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率，应对业务高峰期的资源需求。适用场景：适合业务量有明显波动的场合，如周期性的数据批处理任务或实时数据处理需求。支持的队列类型：

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
CREATE TABLE AS SELECT - 数据湖探索 DLI

SELECT所需权限列表权限描述数据库的CREATE_TABLE权限查询表的SELECT权限细粒度权限：dli:database:createTable, dli:table:select。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例创建分区表

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

范围内的窗口、FOLLOWING 所描述的区间并未支持。 ORDER BY 必须指定于单个的时间属性。可以在一个 SELECT 子句中定义多个 OVER 窗口聚合。然而，对于流式查询，由于目前的限制，所有聚合的 OVER 窗口必须是相同的。 OVER 窗口需要数据是有序的。因为表没有固定的排序，所以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
获取指定集群信息（废弃） - 数据湖探索 DLI

create_time 是 Long 创建集群的时间。是单位为“毫秒”的时间戳。 description 否 String 集群的描述信息。 cu_count 是 Integer 与集群绑定的计算单元个数。 owner 是 String 创建集群的用户。 cluster_name 是 String

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_insert：该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高的，但是无法控制小

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
DLI SDK功能矩阵 - 数据湖探索 DLI

SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK

总条数： 920

上一页
1
...
39
40
41
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI分析账单消费数据 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

数据库相关 - 数据湖探索 DLI

OrderBy & Limit - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

OrderBy & Limit - 数据湖探索 DLI

去重 - 数据湖探索 DLI

Flink作业模板相关 - 数据湖探索 DLI

alias - 数据湖探索 DLI

如何合并小文件 - 数据湖探索 DLI

OrderBy & Limit - 数据湖探索 DLI

去重 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

获取指定集群信息（废弃） - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线