搜索_华为云

导出SQL作业结果 - 数据湖探索 DLI

|，并且不能以“.”开头和结尾。例如选择存储路径obs://bucket/src1/后，需手动补充路径名称为obs://bucket/src1/src2/，且确保src1下不存在src2的目录。那么导出的作业结果的路径为obs://bucket/src1/src2/test.csv

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
文件系统输出流(推荐） - 数据湖探索 DLI

使用文件系统输出流写入数据到OBS时，应避免多个作业写同一个目录的情况。 OBS对象存储桶的默认行为为覆盖写，可能导致数据丢失。 OBS并行文件系统桶的默认行为追加写，可能导致数据混淆。因为以上OBS桶类型行为的区别，为避免作业异常重启可能导致的数据异常问题，请根据您的业务需求选择OBS桶类型。 HDFS代理用户配置

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
文件系统输出流(推荐） - 数据湖探索 DLI

使用文件系统输出流写入数据到OBS时，应避免多个作业写同一个目录的情况。 OBS对象存储桶的默认行为为覆盖写，可能导致数据丢失。 OBS并行文件系统桶的默认行为追加写，可能导致数据混淆。因为以上OBS桶类型行为的区别，为避免作业异常重启可能导致的数据异常问题，请根据您的业务需求选择OBS桶类型。 HDFS代理用户配置

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
如何合并小文件 - 数据湖探索 DLI

TABLE tablename select * FROM tablename distribute by rand() 父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
SDK的获取与安装 - 数据湖探索 DLI

Maven版本信息表示成功。 Maven安装完成后，可根据开发需要，直接引入依赖到已有的Maven工程或先用开发工具创建Maven工程。创建项目以idea开发工具为例(已有Maven 工程可跳过此步骤)：打开IntelliJ IDEA 开发工具。点击File - New - project

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Spark jar 如何读取上传文件 - 数据湖探索 DLI

fromFile(SparkFiles.get("test")).mkString)).collect() } } 父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

fileName为需要访问的文件名。本节示例适用于Flink 1.12版本。Flink 1.15版本的Jar作业开发指导请参考Flink Jar写入数据到OBS开发指南。配置文件使用方法方案一：直接在main函数里面加载文件内容到内存，然后广播到各个taskmanager，

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

步骤1：上传数据至OBS 参考Spark作业样例代码开发Spark Jar作业程序，编译并打包为“spark-examples.jar”。参考以下操作步骤上传该作业程序。提交Spark作业之前，需要在OBS中上传数据文件。登录管理控制台在服务列表中，单击“存储”中的“对象存储服务OBS”，进入OBS管理控制台页面。

帮助中心 > 数据湖探索 DLI > 快速入门
count函数如何进行聚合 - 数据湖探索 DLI

apigateway WHERE service_id = 'ecs' DISTRIBUTE BY http_method 父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

SQL使用DEW管理访问凭据。 Flink Jar 作业使用固定AKSK访问OBS、Flink Jar 获取委托的临时AKSK、Flink SQL UDF 获取委托的临时AKSK场景。请参考Flink作业委托场景开发指导。 Flink 1.15 Jar 读取用户自定义配置文件的方式相比Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
DLI Flink作业支持哪些数据格式和数据源？ - 数据湖探索 DLI

Kafka，开源Kafka，文件系统，OBS，RDS，SMN 表1 数据格式和支持的输入输出流数据格式支持的输入流支持的输出流 Avro - OBS输出流 Avro_merge - OBS输出流 BLOB DIS输入流 MRS Kafka输入流开源Kafka输入流 - CSV DIS输入流 OBS输入流

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

创建函数功能描述 DLI支持创建使用UDF和UDTF等自定义函数应用于Spark作业开发当中。具体使用自定义函数端到端的开发指导可以参考：Spark SQL作业使用UDF和Spark SQL作业使用UDTF。语法格式 1 2 3 4 5 CREATE FUNCTION [db_name

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 自定义函数
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

创建函数功能描述 DLI支持创建使用UDF和UDTF等自定义函数应用于Spark作业开发当中。具体使用自定义函数端到端的开发指导可以参考：Spark SQL作业使用UDF和Spark SQL作业使用UDTF。语法格式 1 2 3 4 5 CREATE FUNCTION [db_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
怎样查看DLI的执行SQL记录？ - 数据湖探索 DLI

在左侧导航栏单击“作业管理”>“SQL作业”进入SQL作业管理页面。输入作业ID或者执行的语句可以筛选所要查看的作业。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
数据湖探索简介 - 数据湖探索 DLI

等。具体内容请参见《数据湖探索开发指南》。存算分离用户将数据存储到OBS后，DLI可以直接和OBS对接进行数据分析。存算分离的架构下，使得存储资源和计算资源可以分开申请和计费，降低了成本并提高了资源利用率。存算分离场景下，DLI支持OBS在创建桶时数据冗余策略选择单AZ或者多AZ存储，两种存储策略区别如下：

帮助中心 > 数据湖探索 DLI > 产品介绍
为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

按需队列，队列已空闲状态（超过1个小时），则后台资源已经释放。此时进行SQL作业的提交。需要等待5~10分钟，待后台重新拉起集群后，即可提交成功。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

资源和成本规划资源资源说明成本说明 OBS 需要创建一个OBS桶将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。 OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
导出查询结果 - 数据湖探索 DLI

OPTIONS：导出时的属性列表，为可选项。参数表1 INSERT OVERWRITE DIRECTORY参数描述参数描述 path 要将查询结果写入的OBS路径。 file_format 写入的文件格式，支持按CSV、Parquet、ORC、JSON、Avro格式。 file_format为c

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

时，在connector中设置账号、密码等属性。 Flink Jar 使用DEW获取访问凭证读写OBS 访问OBS的AKSK为例介绍Flink Jar使用DEW获取访问凭证读写OBS的操作指导。用户获取Flink作业委托临时凭证 DLI提供了一个通用接口，可用于获取用户在启动F

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI读写外部数据源数据

总条数： 805

上一页
1
...
10
11
12
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导出SQL作业结果 - 数据湖探索 DLI

文件系统输出流(推荐） - 数据湖探索 DLI

文件系统输出流(推荐） - 数据湖探索 DLI

如何合并小文件 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

DLI Flink作业支持哪些数据格式和数据源？ - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

怎样查看DLI的执行SQL记录？ - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线