搜索_华为云

使用DLI分析账单消费数据 - 数据湖探索 DLI

使用DLI分析账单消费数据应用场景本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：

帮助中心 > 数据湖探索 DLI > 最佳实践
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie_approx percentile_approx函数用于计算近似百分位数，适用于大数据量。先对指定列升序排列，然后取第p位百分数最靠近的值。命令格式 percentile_approx (colname,DOUBLE p) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
资产识别与管理 - 数据湖探索 DLI

资产识别与管理 DLI 可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

Flink生态和接口，是集实时分析、离线分析、交互式分析为一体的Serverless大数据计算分析服务。线下应用可无缝平滑迁移上云，减少迁移工作量。采用批流融合高扩展性框架，为TB~EB级数据提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。产品内核及架构深度优化，综合性能是传统MapReduce模型的百倍以上，SLA保障99

帮助中心 > 数据湖探索 DLI > 产品介绍
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

HetuEngine是华为推出的高性能交互式SQL分析及数据虚拟化引擎，能够与大数据生态无缝融合，实现海量数据的秒级交互式查询。 DLI+HetuEngine能够快速处理大规模数据集的查询请求，迅速和高效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

S服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。 MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。具体请参考《MapReduce服务开发指南》。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Hudi表索引设计规范 - 数据湖探索 DLI

作业状态后端压力很大，需要优化状态后端参数才能维持性能；同时由于Flink冷启动的时候需要遍历全表数据，大数据量也会导致Flink作业启动缓慢。因此基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？问题现象客户创建增强型跨源连接DLI和DWS，安全组已配置出方向规则到关联队列，使用的是密码形式的跨源认证，报DLI.0999: PSQLException: The connection attempt failed。原因分析出现该问题可能原因如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
与其他云服务的关系 - 数据湖探索 DLI

Studio）的关系在数据治理中心DataArts Studio中，数据开发是一个一站式的大数据协同开发平台，提供全托管的大数据调度能力。它可管理多种大数据服务，极大降低用户使用大数据的门槛，帮助用户快速构建大数据处理中心。通过数据治理中心的DLI SQL节点传递SQL语句到DLI中执行，请参考《DLI

帮助中心 > 数据湖探索 DLI > 产品介绍
数据湖探索简介 - 数据湖探索 DLI

数据治理中心DataArts Studio具有数据全生命周期管理、智能数据管理能力的一站式治理运营平台，支持行业知识库智能化建设，支持大数据存储、大数据计算分析引擎等数据底座，帮助企业快速构建从数据接入到数据分析的端到端智能数据系统，消除数据孤岛，统一数据标准，加快数据变现，实现数字化转型。

帮助中心 > 数据湖探索 DLI > 产品介绍
数学函数概览 - 数据湖探索 DLI

percentlie_approx percentile_approx (colname,DOUBLE p) DOUBLE或ARRAY 计算近似百分位数，适用于大数据量。先对指定列升序排列，然后取第p位百分数对应的值。 pi pi() DOUBLE 返回pi的值。 pmod pmod(INT a, INT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
创建Bucket索引表调优 - 数据湖探索 DLI

最近一个月最大数据量分区数据总条数 = 入湖前咨询产品线单条数据大小 = 平均 1KB（华为建议通过select * from tablename limit 100，得出100条数据的大小，再除以100得到单条平均大小）单分区数据量大小(G) = 最近一个月最大数据量分区数据

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Spark 3.3.1版本说明 - 数据湖探索 DLI

表1 Spark 3.3.1版本优势特性说明 Native性能加速 Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？不存在。 DLI没有启动spark.acls.enable配置项，所以不涉及Apache Spark 命令注入漏洞（CVE-2022-33891）。该漏洞主要影响在启用了ACL（访问控制列表

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

使用DEW管理数据源访问凭证使用DLI提交作业读写外部数据源数据时，需要妥善保存数据源的访问凭证确保数据源认证的安全性，便于DLI安全访问数据源。数据加密服务（Data Encryption Workshop, DEW）是一个综合的云上数据加密服务，为您解决数据安全、密钥安全、

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
查询SQL作业日志 - 数据湖探索 DLI

转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Serv

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
监控安全风险 - 数据湖探索 DLI

监控安全风险云监控服务为用户的云上资源提供了立体化监控平台。通过云监控您可以全面了解云上的资源使用情况、业务的运行状况，并及时收到异常告警做出反应，保证业务顺畅运行。 DLI服务提供基于云监控服务CES的资源监控能力 DLI已对接云监控服务，提供基于云监控服务的资源监控能力，帮

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
手动续费 - 数据湖探索 DLI
手动续费 - 数据湖探索 DLI

手动续费在云服务控制台续费登录管理控制台。单击左侧导航栏的图标，选择“大数据 > 数据湖探索 DLI”。在队列或弹性资源池的列表页，选中待续费的包年/包月资源。单击“操作”列下的“更多 > 续费”。选择续费时长，判断是否勾选“统一到期日”，将到期时间统一到各个月的某一

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费

总条数： 227

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI分析账单消费数据 - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

数学函数概览 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

监控安全风险 - 数据湖探索 DLI

手动续费 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线