搜索_华为云

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 YongHong BI是一款企业级数据分析工具。支持数据可视化、报表制作、数据分析和决策支持的功能，帮助企业洞察业务数据，提升决策效率。本节操作介绍YongHong BI连接DLI的操作步骤。操作前准备环境要求：已安装

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Flink作业推荐配置指导 - 数据湖探索 DLI

Flink作业推荐配置指导用户在创建Flink作业时，可以通过如下配置实现流应用的高可靠性能。用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。图1 创建主题图2

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF 操作场景 DLI支持用户使用Hive UDTF（User-Defined Table-Generating Functions）自定义表值函数，UDTF用于解决一进多出业务场景，即其输入与输出是一对多的关系，读入一行数据，输出多个值。约束限制

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用DLI分析电商BI报表 - 数据湖探索 DLI

使用DLI分析电商BI报表应用场景某电商商城在保持高速发展的同时，沉淀了数亿的忠实用户，积累了海量的真实数据。如何利用BI工具从历史数据中找出商机，是大数据应用在精准营销中的关键问题，也是所有电商平台在做智能化升级时所需要的核心技术。本案例以某商城真实的用户、商品、评论数据（

帮助中心 > 数据湖探索 DLI > 最佳实践
在Spark SQL作业中使用UDF - 数据湖探索 DLI

在Spark SQL作业中使用UDF 操作场景 DLI支持用户使用Hive UDF（User Defined Function，用户定义函数）进行数据查询等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

Hudi查询类型快照查询快照查询（Snapshot Queries）可以读到最新的commit/compaction产生的快照。对于MOR表，还会在查询中合并最新的delta log文件的内容，使读取的数据近实时。增量查询增量查询（Incremental Queries）只会查询到给定的

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项，

帮助中心 > 数据湖探索 DLI > 最佳实践
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

创建Flink OpenSource SQL作业本章节介绍如何新建Flink OpenSource SQL作业。 DLI Flink OpenSource SQL类型作业完全兼容社区Flink版本，并在社区connector基础之上，新增了Redis、DWS(GaussDB)数据源类型

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据操作场景 DLI完全兼容开源的Apache Spark，支持用户开发应用程序代码来进行作业数据的导入、查询以及分析处理。本示例从编写Spark程序代码读取和查询OBS数据、编译打包到提交Spark Jar作业等完整的操作步骤说明来帮助您在

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

如何给子用户授权查看Flink作业？子用户使用DLI时，可以查看队列，但是不能查看Flink作业，可以通过在DLI中对子用户授权，或在IAM中对子用户授权： DLI授权管理使用租户账号，或者作业owner账号，或有DLI Service Administrator权限的账号，登录

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？问题现象 Jobmanager与Taskmanager心跳超时，导致Flink作业异常。图1 异常信息根因分析检查网络是否发生闪断，分析集群负载是否很高。如果频繁出现Full GC, 建议排查代码

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
了解数据目录、数据库和表 - 数据湖探索 DLI

了解数据目录、数据库和表数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

使用DLI分析电商实时业务数据应用场景当前线上购物无疑是最火热的购物方式，而电商平台则又可以以多种方式接入，例如通过web方式访问、通过app的方式访问、通过微信小程序的方式访问等等。而电商平台则需要每天统计各平台的实时访问数据量、订单数、访问人数等等指标，从而能在显示大屏上实时展示相关数据

 帮助中心 > 数据湖探索 DLI > 最佳实践
查询Flink作业日志 - 数据湖探索 DLI

查询Flink作业日志操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并查看Flink作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDAF 操作场景 DLI支持用户使用Hive UDAF（User Defined Aggregation Function，用户定义聚合函数）可对多行数据产生作用，通常与groupBy联合使用；等同于SQL中常用的SUM()，AVG()，也是聚合函数

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ DLI Flink提供了完整可靠的Checkpoint/Savepoint机制，您可以利用该机制，保证在手动重启或者作业异常重启场景下，不丢失数据。为了避免系统故障导致作业异常自动重启后，丢失数据：对于Flink SQL作业，您可以勾选

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

自动续费自动续费可以减少手动续费的管理成本，避免因忘记手动续费而导致资源被自动删除。自动续费的规则如下所述：以资源的到期日计算第一次自动续费日期和计费周期。您可以在购买资源时开通自动续费，在购买资源时，自动续费周期以实际选择的续费时长为准。在到期前均可开通自动续费，到期前7

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费

总条数： 313

上一页
1
...
6
7
8
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线