搜索_华为云

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

登录OBS控制台，将生成的Jar包文件上传到OBS路径下。登录DLI控制台，选择“作业管理 > Spark作业”。单击操作列“编辑”。编辑“应用程序”，选择1上传的OBS地址。图11 配置应用程序 Spark 3.3以下版本：分别上传Jar包到OBS和DLI下。登录OBS控制台，将生成的Jar包文件上传到OBS路径下。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
条件函数 - 数据湖探索 DLI
条件函数 - 数据湖探索 DLI

IS_ALPHA(string) 如果字符串中的所有字符都是字母，则返回 true，否则返回 false。 IS_DECIMAL(string) 如果 string 可以解析为有效数字，则返回 true，否则返回 false。 IS_DIGIT(string) 如果字符串中的所有字符都是数字，则返回 true，否则返回

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
使用DLI进行账单分析与优化 - 数据湖探索 DLI

STRING, `c50name` STRING, `c51name` STRING, `c52name` STRING, `c53name` STRING, `c54name` STRING ) USING csv options ( path 'obs://

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

基于文件的权限管理。高性能性能基于软硬件一体化的深度垂直优化。大数据开源版本性能。跨源分析支持多种数据格式，云上多种数据源、ECS自建数据库以及线下数据库，数据无需搬迁，即可实现对云上多个数据源进行分析，构建企业的统一视图，帮助企业快速完成业务创新和数据价值探索。

帮助中心 > 数据湖探索 DLI > 产品介绍
批作业SQL常用配置项说明 - 数据湖探索 DLI

分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

登录OBS控制台，将生成的Jar包文件上传到OBS路径下。登录DLI控制台，选择“作业管理 > Spark作业”。单击操作列“编辑”。编辑“应用程序”，选择1上传的OBS地址。图11 配置应用程序 Spark 3.3以下版本：分别上传Jar包到OBS和DLI下。登录OBS控制台，将生成的Jar包文件上传到OBS路径下。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

创建数据库功能描述创建数据库。语法格式 1 2 3 CREATE [DATABASE | SCHEMA] [IF NOT EXISTS] db_name [COMMENT db_comment] [WITH DBPROPERTIES (property_name=property_value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
OBS输入流 - 数据湖探索 DLI
OBS输入流 - 数据湖探索 DLI

当引用符号为单引号时，则设置quote = "'"。说明：目前只适用于CSV格式。设置引用符号后，必须保证每个字段中包含0个或者偶数个引用符号，否则会解析失败。 version_id 否版本号，当obs里的桶或对象有设置版本的时候需填写，否则不用配置该项。注意事项在创建Source S

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
OBS输入流 - 数据湖探索 DLI
OBS输入流 - 数据湖探索 DLI

当引用符号为单引号时，则设置quote = "'"。说明：目前只适用于CSV格式。设置引用符号后，必须保证每个字段中包含0个或者偶数个引用符号，否则会解析失败。 version_id 否版本号，当obs里的桶或对象有设置版本的时候需填写，否则不用配置该项。注意事项在创建Source S

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

创建数据库功能描述创建数据库。语法格式 1 2 3 CREATE [DATABASE | SCHEMA] [IF NOT EXISTS] db_name [COMMENT db_comment] [WITH DBPROPERTIES (property_name=property_value

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 数据库
Spark SQL常用配置项说明 - 数据湖探索 DLI

分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
DIS输入流 - 数据湖探索 DLI
DIS输入流 - 数据湖探索 DLI

_config”属性。若编码格式为“email”，则需配置“email_key”属性。若编码格式为“blob”，表示不对接收的数据进行解析，流属性仅能有一个且数据格式为ARRAY[TINYINT]。若编码格式为“user_defined”，则需配置“encode_class

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
DIS输入流 - 数据湖探索 DLI
DIS输入流 - 数据湖探索 DLI

_config”属性。若编码格式为“email”，则需配置“email_key”属性。若编码格式为“blob”，表示不对接收的数据进行解析，流属性仅能有一个且数据格式为ARRAY[TINYINT]。若编码格式为“user_defined”，则需配置“encode_class

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据场景描述 DLI可以查询存储在OBS中的数据，本节操作介绍使用DLI提交SQL作业查询OBS数据的操作步骤。本例新建“sampledata.csv”文件上传OBS桶，并新建弹性资源池队列，使用DLI创建数据库和表，使用DLI提供的SQL编辑器查询表的1000条数据。

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功；否则表示未成功。在MySQL的flink数据库下创建表order_count，创建语句如下：

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功；否则表示未成功。在MySQL的flink数据库下创建表order_count，创建语句如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功；否则表示未成功。在MySQL的flink数据库下创建表order_count，创建语句如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

json_path) 表2 参数说明参数数据类型说明 json_string STRING 需要解析的JSON对象，使用字符串表示。 json_path STRING 解析JSON的路径表达式，使用字符串表示。目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 491

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

条件函数 - 数据湖探索 DLI

使用DLI进行账单分析与优化 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

批作业SQL常用配置项说明 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

OBS输入流 - 数据湖探索 DLI

OBS输入流 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

DIS输入流 - 数据湖探索 DLI

DIS输入流 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线