搜索_华为云

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

步骤3：使用DEW管理访问凭证跨源分析场景中，使用DEW管理数据源的访问凭证，并创建允许DLI访问DEW的委托。步骤4：创建自定义委托允许DLI访问DEW读取凭证创建允许DLI访问DEW的委托。步骤5：提交Spark作业创建Spark Jar作业分析数据。准备工作已注册华为

 帮助中心 > 数据湖探索 DLI > 快速入门
对象存储OBS结果表 - 数据湖探索 DLI

对象存储OBS结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
配置SQL防御规则 - 数据湖探索 DLI

时写入到防御审计日志中。运维人员可进行日志分析，评估现网SQL质量，提前感知潜在SQL风险，并做出有效预防措施。本节操作介绍创建SQL防御规则以增加SQL防御能力的配置方法。 DLI SQL防御规则约束与限制仅Spark 3.3.x及以上版本支持SQL防御功能。同一个队列，同一个动作的防御规则仅支持创建一条。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

I默认无法直接读取这些数据源的数据。通过创建增强型跨源连接，可以采用对等连接的方式打通DLI与数据源的VPC网络，从而实现数据的互通和跨源分析。增强型跨源连接的优势：网络连通性：直接打通DLI与目的数据源的VPC网络实现数据互通。支持多种数据源：支持DLI与多种数据源的网络

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
最佳实践内容概览 - 数据湖探索 DLI

行电商BI报表分析的方法。使用DLI分析账单消费数据以DLI实际消费数据为样例，介绍使用DLI进行账单分析和成本优化的措施。使用DLI分析电商实时业务数据使用DLI Flink完成电商业务实时数据的分析处理。配置DBeaver连接DLI进行数据查询和分析介绍DBeav

帮助中心 > 数据湖探索 DLI > 最佳实践
DLI作业开发流程 - 数据湖探索 DLI

适用范围：Spark 3.3.1及以上版本、Flink 1.15及以上版本。具体操作请参考使用DEW管理数据源访问凭证和配置DLI访问其他云服务的委托权限。使用DLI提交作业 DLI提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，支持多种作业类型以满足不同的数据处理需求。

帮助中心 > 数据湖探索 DLI > 用户指南
Spark SQL常用配置项说明 - 数据湖探索 DLI

spark.sql.keep.distinct.expandThreshold - 参数说明：对于包含count(distinct)的多维分析（with cube）的查询场景，spark典型的执行计划是将cube使用expand算子来实现，但该操作会导致查询膨胀，为了避免出现查询膨胀，建议执行如下配置：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略场景介绍一个企业有多个部门，多个部门不同业务数据分析的时间段可能有所差异，具体场景如下： A部门：在00:00-09:00时间段内资源请求量大，其他时间段有短时间的资源请求量不大的任务运行。 B部门：在10:00-22:00时间段内资

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
与其他云服务的关系 - 数据湖探索 DLI

中。通过DLI跨源连接访问CloudTable数据请参考《跨源分析开发方式参考》。与关系型数据库服务（RDS）的关系关系型数据库（Relational Database Service）作为DLI的数据来源及数据存储，与DLI配合一起使用，关系有如下两种。数据来源：DLI

帮助中心 > 数据湖探索 DLI > 产品介绍
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

HetuEngine是华为推出的高性能交互式SQL分析及数据虚拟化引擎，能够与大数据生态无缝融合，实现海量数据的秒级交互式查询。 DLI+HetuEngine能够快速处理大规模数据集的查询请求，迅速和高效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

avro类型的OBS创建失败根因分析当前Spark2.3.x不支持创建avro类型的OBS表，Spark2.4.x及以上的版本支持avro类型的OBS表。解决方案在使用DataSource语法创建avro类型的OBS表时，请选择Spark2.4.x及以上版本进行创建。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
添加分区（只支持OBS表） - 数据湖探索 DLI

partition_specs LOCATION 'obs_path'。若新增分区指定的路径包含子目录（或嵌套子目录），则子目录下面的所有文件类型及内容也将作为该分区的记录。您需要保证该分区目录下所有文件类型和文件内容与表的字段一致，否则查询将报错。您可以在建表语句OPTIONS中设

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

Spark、Apache Flink、HetuEngine生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。企业使用标准SQL、Spark、Flink程序就可轻松完成多数据源的联合计算分析，挖掘和探索数据价值。发布区域：全部 Serverless DLI与自建Hadoop对比优势

 帮助中心 > 数据湖探索 DLI > 功能总览
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

sert into，load data）时由于数据源不支持事务性，在系统故障或队列资源重启后，可能会导致数据重复或数据不一致等问题。原因分析：在数据的Commit阶段如果出现队列资源重启可能会导致数据已经被修复到正式目录中。如果执行的是Insert into语句，资源重启后触发重试就会有概率导致数据重复写入。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
数据湖探索 DLI - 数据湖探索 DLI

数据湖探索Spark作业入门指导数据湖探索 DLI 介绍怎样使用Flink SQL进行电商实时业务数据分析 23:40 使用DLI Flink SQL进行电商实时业务数据分析

 帮助中心 > 数据湖探索 DLI > 视频帮助
权限管理概述 - 数据湖探索 DLI

Administrator）的子账号用于管理和使用DLI服务。“基础平台组组长”按照公司两个业务对于数据分析的要求，创建了“队列A”分配给“数据工程师A”运行游戏数据分析业务，“队列B”分配给“数据工程师B”运行音乐数据分析业务，并分别赋予“DLI普通用户”权限，具有队列使用权限，数据（除数据库）的管理和使用权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

导入业务数据：提交SQL脚本导入业务数据。请参考步骤2：业务数据的计算与处理。数据查询与分析：提交SQL脚本分析业务数据，例如查询单日销售情况。请参考步骤3：销售情况的查询与分析。作用编排：将数据处理和数据分析脚本编排成一个pipeline。DataArt会按照编排好的pipeline顺

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
内置函数 - 数据湖探索 DLI
内置函数 - 数据湖探索 DLI

内置函数日期函数字符串函数数学函数聚合函数分析窗口函数其他函数

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考

总条数： 287

上一页
1
...
4
5
6
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

最佳实践内容概览 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

数据湖探索 DLI - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

内置函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线