搜索_华为云

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF 操作场景 DLI支持用户使用Hive UDTF（User-Defined Table-Generating Functions）自定义表值函数，UDTF用于解决一进多出业务场景，即其输入与输出是一对多的关系，读入一行数据，输出多个值。约束限制

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

如何给子用户授权查看Flink作业？子用户使用DLI时，可以查看队列，但是不能查看Flink作业，可以通过在DLI中对子用户授权，或在IAM中对子用户授权： DLI授权管理使用租户账号，或者作业owner账号，或有DLI Service Administrator权限的账号，登录

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通操作场景公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
了解数据目录、数据库和表 - 数据湖探索 DLI

了解数据目录、数据库和表数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据操作场景 DLI完全兼容开源的Apache Spark，支持用户开发应用程序代码来进行作业数据的导入、查询以及分析处理。本示例从编写Spark程序代码读取和查询OBS数据、编译打包到提交Spark Jar作业等完整的操作步骤说明来帮助您在

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
永洪BI添加数据源 - 数据湖探索 DLI

永洪BI添加数据源操作场景在永洪SaaS生产环境中添加DLI的数据源。操作步骤在永洪SaaS生产环境主页，单击左侧导航栏中的“添加数据源”，请参见图1。图1 添加数据源 “选择数据源类型”页面中，新建数据源类型选择“GENERIC”。请参见图2。图2 选择数据源类型添加数据源的相关配置

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析 > 永洪BI对接DLI提交Spark作业
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项，

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

自动续费自动续费可以减少手动续费的管理成本，避免因忘记手动续费而导致资源被自动删除。自动续费的规则如下所述：以资源的到期日计算第一次自动续费日期和计费周期。您可以在购买资源时开通自动续费，在购买资源时，自动续费周期以实际选择的续费时长为准。在到期前均可开通自动续费，到期前7

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？问题现象 Jobmanager与Taskmanager心跳超时，导致Flink作业异常。图1 异常信息根因分析检查网络是否发生闪断，分析集群负载是否很高。如果频繁出现Full GC, 建议排查代码

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ DLI Flink提供了完整可靠的Checkpoint/Savepoint机制，您可以利用该机制，保证在手动重启或者作业异常重启场景下，不丢失数据。为了避免系统故障导致作业异常自动重启后，丢失数据：对于Flink SQL作业，您可以勾选

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用DLI Flink SQL进行电商实时业务数据分析 - 数据湖探索 DLI

使用DLI Flink SQL进行电商实时业务数据分析应用场景当前线上购物无疑是最火热的购物方式，而电商平台则又可以以多种方式接入，例如通过web方式访问、通过app的方式访问、通过微信小程序的方式访问等等。而电商平台则需要每天统计各平台的实时访问数据量、订单数、访问人数等等指标

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启）操作场景本节操作介绍创建Flink作业时，配置流应用实现高可靠性能的操作方法。操作步骤用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDAF 操作场景 DLI支持用户使用Hive UDAF（User Defined Aggregation Function，用户定义聚合函数）可对多行数据产生作用，通常与groupBy联合使用；等同于SQL中常用的SUM()，AVG()，也是聚合函数

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

怎样配置DLI队列与数据源的网络连通？配置DLI队列与内网数据源的网络连通 DLI在创建运行作业需要连接外部其他数据源，如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。 DLI提供的增强型跨源连接功能，底层采用对等连接的方式打通与目的数据源的

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

使用Spark作业访问DLI元数据操作场景 DLI支持用户编写代码创建Spark作业来创建数据库、创建DLI表或OBS表和插入表数据等操作。本示例完整的演示通过编写java代码、使用Spark作业创建数据库、创建表和插入表数据的详细操作，帮助您在DLI上进行作业开发。该功能公测阶段

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
创建并提交SQL作业 - 数据湖探索 DLI

创建并提交SQL作业 SQL编辑器简介 SQL作业编辑器支持使用SQL语句执行数据查询操作。支持SQL2003，兼容SparkSQL，详细语法描述请参见《数据湖探索SQL语法参考》。在总览页面，单击左侧导航栏中的“SQL编辑器”或SQL作业简介右上角的“创建作业”，可进入“SQL

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询Flink作业日志 - 数据湖探索 DLI

查询Flink作业日志操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并查看Flink作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Python开发环境配置 - 数据湖探索 DLI

Python开发环境配置操作场景在安装和使用Python SDK前，确保您已经完成开发环境的基本配置。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置

总条数： 280

上一页
1
...
4
5
6
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

永洪BI添加数据源 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

使用DLI Flink SQL进行电商实时业务数据分析 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线