搜索_华为云

Spark作业使用咨询 - 数据湖探索 DLI

Spark作业使用咨询 DLI Spark作业是否支持定时周期任务作业 DLI Spark不支持作业调度，用户可以通过其他服务，例如数据湖管理治理中心DataArts Studio服务进行调度，或者通过API/SDK等方式对作业进行自定义调度。使用DataArts Studio

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明 mongo只支持增强型跨源。只能使用包年包月队列。 DDS即文档数据库服务，兼容MongoDB协议。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
DLI对接LakeFormation - 数据湖探索 DLI

DLI对接LakeFormation 操作场景 LakeFormation是企业级一站式湖仓构建服务，提供元数据统一管理能力，支持无缝对接多种计算引擎及大数据云服务，使客户便捷高效地构建数据湖和运营相关业务，加速释放业务数据价值。在Spark作业和SQL作业场景，支持对接LakeFormation

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明 mongo只支持增强型跨源。只能使用包年包月队列。 DDS即文档数据库服务，兼容MongoDB协议。在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明支持对接CloudTable的OpenTSDB和MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
（推荐）DLI SDK V3 - 数据湖探索 DLI

（推荐）DLI SDK V3 写作说明本文介绍了DLI服务提供的V3版本的SDK，列举了最新版本SDK的获取地址。 SDK列表表1提供了DLI云服务支持的SDK列表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。表1 SDK列表编程语言 Github

帮助中心 > 数据湖探索 DLI > SDK参考
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南概述 DLI提供了使用自定义Jar运行Flink作业并将数据写入到OBS的能力。本章节JAVA样例代码演示将kafka数据处理后写入到OBS，具体参数配置请根据实际环境修改。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明本样例只适用于MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python SDK概述操作场景 DLI SDK让您无需关心请求细节即可快速使用数据湖探索服务。本节操作介绍如何在Python环境获取并使用SDK。使用须知要使用DLI Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

Java SDK概述操作场景 DLI Java SDK 让您无需关心请求细节即可快速使用数据湖探索服务。本节操作介绍如何获取并使用Java SDK 。使用须知要使用DLI Java SDK 访问指定服务的 API ，您需要确认已在DLI控制台开通当前服务并完成服务授权。 Java

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

使用SQL作业模板开发并提交SQL作业为了便捷快速地执行SQL操作，DLI支持定制模板或将正在使用的SQL语句保存为模板。保存模板后，不需编写SQL语句，可通过模板直接执行SQL操作。当前系统提供了多条标准的TPC-H查询语句模板，您可以按需选择自定义模板或系统模板创建SQL作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
DLI Delta表概述 - 数据湖探索 DLI

DLI Delta表概述 Delta表是一种基于Delta Lake技术实现的数据存储解决方案，它使用基于文件的事务日志扩展了 Parquet 数据文件，可以处理 ACID 事务和可缩放的元数据。 Delta Lake与Apache Spark API完全兼容，并且其设计能够与结构化流式处理紧密集成

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
Hudi Clustering操作说明 - 数据湖探索 DLI

Hudi Clustering操作说明什么是Clustering 即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hudi

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK （推荐）方案1：使用临时AK/SK 建议使用临时AK/SK，获取方式可参见统一身份认证服务_获取临时AK/SK。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。表

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka 概述本节操作介绍使用Flink Jar连接开启SASL_SSL认证的Kafka的操作方法。如需使用Flink OpenSource SQL连接开启SASL_SSL认证的Kafka，请参考Flink SQL语法参考-

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
SDK获取与安装 - 数据湖探索 DLI

SDK获取与安装 Python SDK安装方式本节操作介绍安装Python SDK的操作指导。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。 “dli-sdk-python-x.x.x.zip”压缩包，解压后目录结构如下

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置

总条数： 769

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark作业使用咨询 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线