搜索_华为云

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

基本概念租户 DLI支持多个组织、部门或应用共享使用资源。通过提供一个逻辑实体来统一使用不同资源和服务，这个逻辑实体就是租户。多个不同的租户统称多租户。租户对应公司。一个租户可以创建多个子用户，并可以对不同用户授予不同权限。项目各个服务中的一些可以访问的资源集合称为项目。一

 帮助中心 > 数据湖探索 DLI > 产品介绍
EdgeHub输出流（EOS） - 数据湖探索 DLI

field_delimiter 否属性分隔符。当“encode”为“csv”时，用于指定csv字段分隔符，默认为“,"。当“encode”为“json”时，不需要设置属性之间的分隔符。 json_config 否当“encode”为“json”时，可以通过该参数指定json字段和流定义字段的映射关系，格式为：

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
Spark SQL语法概览 - 数据湖探索 DLI

自定义函数相关语法创建函数删除函数显示函数详情显示所有函数数据多版本相关语法创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
常用操作与系统权限关系 - 数据湖探索 DLI

ALTER_TABLE_RECOVER_PARTITION 恢复表分区 √ × √ √ ALTER_TABLE_SET_LOCATION 设置分区路径 √ × √ √ GRANT_PRIVILEGE 表的赋权 √ × √ √ REVOKE_PRIVILEGE 表权限的回收 √ ×

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
使用Hive语法创建DLI表 - 数据湖探索 DLI

= true ); 示例6：创建textfile格式的非分区表，并设置ROW FORMAT 示例说明：本例创建名为table4的textfile类型的非分区表，并设置ROW FORMAT相关格式（ROW FORMAT功能只支持textfile类型的表）。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
pyspark样例代码 - 数据湖探索 DLI

IntegerType, StringType, Row from pyspark.sql import SparkSession 创建会话并设置AK/SK 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
查询作业列表 - 数据湖探索 DLI

“show_detail”为“true”时独有。最小值：2 最大值：400 默认为“2”。 parallel_number 否 Integer 用户设置的作业并行数。 “show_detail”为“true”时独有。最小值：1 最大值：2000 默认为“1”。 restart_when_exception

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查询作业详情 - 数据湖探索 DLI

“show_detail”为“true”时独有。最小值：2 最大值：400 默认为“2”。 parallel_number 否 Integer 用户设置的作业并行数。 “show_detail”为“true”时独有。最小值：1 最大值：2000 默认为“1”。 smn_topic 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
EdgeHub输入流（EOS） - 数据湖探索 DLI

field_delimiter 否属性分隔符。当“encode”为“csv”时，用于指定csv字段分隔符，默认为“,"。当“encode”为“json”时，不需要设置属性之间的分隔符。 json_config 否当“encode”为“json”时，可以通过该参数指定json字段和流定义字段的映射关系，格式为：

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
初始化DLI客户端 - 数据湖探索 DLI

险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称 projectId ：项目ID 通过以下方式可

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

STRUCT 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列> 找到作业的所属队列> 更多> 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
初始化DLI客户端 - 数据湖探索 DLI

险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称 projectId ：项目ID 通过以下方式可

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
类型转换函数 - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource (

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
类型转换函数 - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
从Kafka读取数据写入到DWS - 数据湖探索 DLI

连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 password ：默认管理员用户的密码。在命令行窗口输入以下命令创建数据库“testdwsdb”。 CREATE

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

计费概述数据湖探索DLI的计费由不同的计费项组成，不同的计费项有不同的计费模式，如图1所示。图1 DLI的计费组成计费项 DLI的计费项包括计算计费、存储计费、扫描量计费。DLI的计费详情请参见DLI产品价格详情。您可以通过DLI提供的价格计算器，快速计算出购买资源的参考价格。

帮助中心 > 数据湖探索 DLI > 计费说明
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 1 2 3 4 5 6 7 8 9 create table printSink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DLI作业开发流程 - 数据湖探索 DLI

DLI作业开发流程本节内容旨在为您提供使用DLI开发作业的操作流程。不同的开发场景根据数据源的接入方式、作业类型开发流程各不相同。创建IAM用户并授权使用DLI 如果您是企业用户，并计划使用IAM对您所拥有的DLI资源进行精细的权限管理，请创建IAM用户并授权使用DLI。具

 帮助中心 > 数据湖探索 DLI > 用户指南
DLI作业开发流程 - 数据湖探索 DLI

DLI作业开发流程本节内容旨在为您提供使用DLI开发作业的操作流程。不同的开发场景根据数据源的接入方式、作业类型开发流程各不相同。创建IAM用户并授权使用DLI 如果您是企业用户，并计划使用IAM对您所拥有的DLI资源进行精细的权限管理，请创建IAM用户并授权使用DLI。具

 帮助中心 > 数据湖探索 DLI > 用户指南

总条数： 536

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

EdgeHub输出流（EOS） - 数据湖探索 DLI

Spark SQL语法概览 - 数据湖探索 DLI

常用操作与系统权限关系 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

EdgeHub输入流（EOS） - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

Print - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线