搜索_华为云

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

k的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。使用限制

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

操作场景 DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。本例介

 帮助中心 > 数据湖探索 DLI > 快速入门
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代码的编写与作

 帮助中心 > 数据湖探索 DLI > 用户指南
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

gz”，支持在Linux环境中使用，且依赖JDK 1.8及以上版本。配置DLI Spark-submit 使用spark-submit的机器安装JDK 1.8或以上版本并配置环境变量，当前仅在Linux环境下使用spark-submit工具。下载并解压工具包“dli-clientkit-<version>-bin

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

启动Superset容器，并将容器的8088端口映射到宿主机的8088端口。访问Superset：在浏览器中访问http://IP:8088 (IP为superset部署的机器)，使用在安装Superset时设置的用户名和密码登录Superset。在Superset中安装和配置DLI驱动以连接数据库。驱动需要

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
DLI作业开发流程 - 数据湖探索 DLI

资源管理和作业调度。支持多种数据源和格式，提供了丰富的数据处理能力，包括但不限于SQL查询、机器学习等。详细操作请参考创建Spark作业。适用于大规模数据处理和分析，如机器学习训练、日志分析、大规模数据挖掘等场景。管理Jar作业的程序包 DLI允许用户提交编译为Jar包的F

帮助中心 > 数据湖探索 DLI > 用户指南
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

恢复什么是从checkpoint恢复？ Flink Checkpoint 是一种容错恢复机制。这种机制保证了实时程序运行时，遇到异常或者机器问题时能够进行自我恢复。从checkpoint恢复的原则通常当作业执行失败、资源异常重启等非人为触发的异常场景时，支持从checkpoint恢复。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

如果创建队列的用户不是管理员用户，在创建队列后，需要管理员用户赋权后才可使用。关于赋权的具体操作请参考《数据湖探索用户指南》。操作步骤在使用JDBC的机器中安装JDK，JDK版本为1.7或以上版本，并配置环境变量。参考下载并安装JDBC驱动包章节，获取DLI JDBC驱动包“huaweic

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

Kubernetes系列课程，带你走进云原生技术的核心 GO语言深入之道介绍几个Go语言及相关开源框架的插件机制跟唐老师学习云网络唐老师将自己对网络的理解分享给大家智能客服您好！我是有问必答知识渊博的的智能问答机器人，有问题欢迎随时求助哦！社区求助华为云社区是华为云用户的聚集地。这里有来自数据湖探索的技术牛人，为您解决技术难题。

帮助中心 > 数据湖探索 DLI > 成长地图
（推荐）DLI SDK V3 - 数据湖探索 DLI

NET SDK视频指导 SDK列表提供了DLI云服务支持的SDK列表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。在线生成SDK代码【样例】 API Explorer能根据需要动态生成SDK代码功能，降低您使用SDK的难度，推荐使用。您可以在API E

帮助中心 > 数据湖探索 DLI > SDK参考
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

即开即用，Serverless架构。需要较强的技术能力进行搭建、配置、运维。高可用具有跨AZ容灾能力。无高易用学习成本学习成本低，包含10年、上千个项目经验固化的调优参数。同时提供可视化智能调优界面。学习成本高，需要了解上百个调优参数。支持数据源云上：OBS、RDS、DWS、CSS、MongoDB、Redis。

帮助中心 > 数据湖探索 DLI > 产品介绍
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

业相关组件都运行在容器中，通过下载DLI提供的自定义镜像，可以改变Spark作业和Flink作业的容器运行环境。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式方便地帮助用户进行功能扩展。发布区域：全部创建自定义镜像

 帮助中心 > 数据湖探索 DLI > 功能总览
DWS Connector概述 - 数据湖探索 DLI

DWS Connector概述数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQ

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

配置数据更新间隔。示例该示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

通常用于结构化数据的查询和分析。 Flink作业 Flink作业专为实时数据流处理设计，适用于低时延、需要快速响应的场景。适用于实时监控、在线分析等场景。 Flink OpenSource作业：提交作业时可以使用DLI提供的标准的连接器（connectors）和丰富的API，快速与其他数据系统的集成。

帮助中心 > 数据湖探索 DLI > 产品介绍
Hudi结果表 - 数据湖探索 DLI
Hudi结果表 - 数据湖探索 DLI

表示永久不失效。 compaction.async.enabled 否 false Boolean 是否开启在线压缩。 true：开启 false：关闭建议关闭在线压缩，提升性能。但是调度compaction.schedule.enabled仍然建议开启，之后可通过离线异步压缩，执行阶段性生成的压缩plan。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 27

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

Hudi结果表 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线