搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码操作场景本例提供使用Spark作业访问DWS数据源的pyspark样例代码。在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 DLI整理了Spark2.4.x与Spark3.3.x版本在通用队列的差异，便于您了解Spark版本升级后通用队列上运行的作业在适配新版本引擎时的影响。 log4j依赖从1.x版本修改为2.x版本说明： log4j依赖从1

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
上传分组资源（废弃） - 数据湖探索 DLI

上传分组资源（废弃）功能介绍该API用于上传分组资源到某个project下。该API对应控制台的创建程序包功能。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2.0/{project_id}/resources

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
查询所有全局变量 - 数据湖探索 DLI

查询所有全局变量功能介绍该API用于查询当前project下所有全局变量的信息。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id}/variables 参数说明表1 URI参数说明参数名称是否必选参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

DLI使用SMN主题，提示SMN主题不存在，怎么处理？设置DLI Flink作业的运行参数时，勾选“作业异常告警”参数，可在作业出现运行异常或者欠费情况时，将作业异常告警信息，以SMN的方式通知用户。如果遇到提示SMN主题不存在您可以按照以下步骤进行排查：确认SMN主题是否已经创建。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 DLI Spark-submit简介 DLI Spark-submit是一个用于提交Spark作业到DLI服务端的命令行工具，该工具提供与开源Spark兼容的命令行。准备工作授权。 DLI使用统一身份认证服务（Identity

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

创建数据库功能描述创建数据库。语法格式 1 2 3 CREATE [DATABASE | SCHEMA] [IF NOT EXISTS] db_name [COMMENT db_comment] [WITH DBPROPERTIES (property_name=property_value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
在DLI控制台创建数据库和表 - 数据湖探索 DLI

在DLI控制台创建数据库和表数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。表是数据库最重要的组成部分之一。表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出DLI表数据至OBS中支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
Spark作业使用咨询 - 数据湖探索 DLI

Spark作业使用咨询 DLI Spark作业是否支持定时周期任务作业 DLI Spark不支持作业调度，用户可以通过其他服务，例如数据湖管理治理中心DataArts Studio服务进行调度，或者通过API/SDK等方式对作业进行自定义调度。使用DataArts Studi

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据场景描述 DLI可以查询存储在OBS中的数据，本节操作介绍使用DLI提交SQL作业查询OBS数据的操作步骤。本例新建“sampledata.csv”文件上传OBS桶，并新建弹性资源池队列，使用DLI创建数据库和表，使用DLI提供的SQL编辑器查询表的1000条数据。

帮助中心 > 数据湖探索 DLI > 快速入门
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功；否则表示未成功。在MySQL的flink数据库下创建表order_count，创建语句如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功；否则表示未成功。在MySQL的flink数据库下创建表order_count，创建语句如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
查询作业模板列表 - 数据湖探索 DLI

查询作业模板列表功能介绍该API用于查询作业模板列表。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v3/{project_id}/templates?type=spark 参数说明表1 URI参数说明参数是否必选参数类型描述

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

JDBC源表功能描述 JDBC连接器是Flink内置的Connector，用于从数据库读取相应的数据。前提条件要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

DataGen源表功能描述 DataGen主要用于生成随机数据，可用于调试以及测试等场景。前提条件无注意事项创建DataGen表时，表字段类型不支持Array，Map和Row复杂类型，可以通过CREATE TABLE语句中的“COMPUTED COLUMN”来进行类似功能构造。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
导入Flink作业 - 数据湖探索 DLI
导入Flink作业 - 数据湖探索 DLI

导入Flink作业功能介绍该API用于导入Flink作业数据。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1.0/{project_id}/streaming/jobs/import 参数说明表1 URI参数说明参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 313

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

查询所有全局变量 - 数据湖探索 DLI

DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

导入Flink作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线