-
OBS输出流 - 数据湖探索 DLI
OBS输出流 功能描述 创建sink流将DLI数据输出到对象存储服务(OBS)。DLI可以将作业分析结果输出到OBS上。适用于大数据分析、原生云应用程序数据、静态网站托管、备份/活跃归档、深度/冷归档等场景。 对象存储服务(Object Storage Service,简称OBS
-
OBS授权 - 数据湖探索 DLI
String bucketName ="obs_name"; ObsBuckets obsBuckets = new ObsBuckets(); obsBuckets.addObsBucketsItem(bucketName);
-
OBS输入流 - 数据湖探索 DLI
OBS输入流 功能描述 创建source流从对象存储服务(OBS)获取数据。DLI从OBS上读取用户存储的数据,作为作业的输入数据。适用于大数据分析、原生云应用程序数据、静态网站托管、备份/活跃归档、深度/冷归档等场景。 对象存储服务(Object Storage Service
-
OBS输入流 - 数据湖探索 DLI
OBS输入流 功能描述 创建source流从对象存储服务(OBS)获取数据。DLI从OBS上读取用户存储的数据,作为作业的输入数据。适用于大数据分析、原生云应用程序数据、静态网站托管、备份/活跃归档、深度/冷归档等场景。 对象存储服务(Object Storage Service
-
OBS输出流 - 数据湖探索 DLI
OBS输出流 功能描述 创建sink流将DLI数据输出到对象存储服务(OBS)。DLI可以将作业分析结果输出到OBS上。适用于大数据分析、原生云应用程序数据、静态网站托管、备份/活跃归档、深度/冷归档等场景。 对象存储服务(Object Storage Service,简称OBS
-
创建OBS表时正确指定OBS路径 - 数据湖探索 DLI
创建OBS表时正确指定OBS路径 场景概述 创建OBS表时,OBS路径须指定到数据库下的具体表层路径。路径格式为:obs://xxx/数据库名/表名。 创建OBS表更多语法介绍请参考《数据湖探索Spark SQL语法参考》。 正确示例 CREATE TABLE `di_selle
-
OBS授权给DLI服务 - 数据湖探索 DLI
OBS授权给DLI服务 功能介绍 用户主动授权OBS桶的操作权限给DLI服务,用于保存用户作业的checkpoint、作业的运行日志等。 当前接口已废弃,不推荐使用。 调试 您可以在API Explorer中调试该接口。 URI URI格式 POST /v1.0/{project
-
创建OBS表 - 数据湖探索 DLI
创建OBS表 使用DataSource语法创建OBS表 使用Hive语法创建OBS表 父主题: Spark SQL语法参考(即将下线)
-
用户导表到OBS报“path obs://xxx already exists”错误 - 数据湖探索 DLI
用户导表到OBS报“path obs://xxx already exists”错误 用户可新建一个不存在的OBS目录或手动删除已存在的OBS目录,再重新提交作业。删除已存在的OBS目录后,目录下的所有数据将会被删除。请谨慎执行此删除操作。 父主题: 作业运维报错
-
使用Hive语法创建OBS表 - 数据湖探索 DLI
file_format 是 OBS表存储格式,支持TEXTFILE, AVRO, ORC, SEQUENCEFILE, RCFILE, PARQUET table_comment 否 表描述。仅支持字符串常量。 obs_path 是 数据文件所在的OBS存储路径,推荐使用OBS并行文件系统存储。 格式
-
创建OBS表 - 数据湖探索 DLI
创建OBS表 使用DataSource语法创建OBS表 使用Hive语法创建OBS表 父主题: 表相关
-
将DLI数据导出至OBS - 数据湖探索 DLI
将DLI数据导出至OBS 支持将数据从DLI表中导出到OBS服务中,导出操作将在OBS服务新建文件夹,或覆盖已有文件夹中的内容。 注意事项 支持导出json格式的文件,且文本格式仅支持UTF-8。 只支持将DLI表(表类型为“Managed”)中的数据导出到OBS桶中,且导出的路径必须指定到文件夹级别。
-
Flink Jar作业设置backend为OBS,报错不支持OBS文件系统 - 数据湖探索 DLI
Jar作业设置backend为OBS,报错不支持OBS文件系统 问题现象 客户执行Flink Jar作业,通过设置checkpoint存储在OBS桶中,作业一直提交失败,并伴有报错提交日志,提示OBS桶名不合法。 关于如何配置checkpoint保存到OBS请参考《数据湖探索常见问题》。
-
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI
SQL作业分析OBS数据 DLI支持将数据存储到OBS上,后续再通过创建OBS表即可对OBS上的数据进行分析和处理。 本指导中的操作内容包括:创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。 前提条件 已创建OBS的桶。具体
-
使用DataSource语法创建OBS表 - 数据湖探索 DLI
(path 'obs://bucketName/filePath') PARTITIONED BY (facultyNo, classNo); 示例3:使用CTAS将源表的全部数据或部分数据创建新的OBS非分区表 示例说明:根据示例1:创建OBS非分区表中创建的OBS表table
-
DWS输出流(通过OBS转储方式) - 数据湖探索 DLI
DWS输出流(通过OBS转储方式) 功能描述 创建sink流将Flink作业数据通过OBS转储方式输出到数据仓库服务(DWS),即Flink作业数据先输出到OBS,然后再从OBS导入到DWS。如何导入OBS数据到DWS具体可参考《数据仓库服务数据库开发指南》中“从OBS并行导入数据到集群”章节。
-
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI
上传数据到OBS桶 OBS控制台 将测试数据上传到OBS桶下。 3 新建Maven工程,配置pom文件 IntelliJ IDEA 参考样例代码说明,编写程序代码读取OBS数据。 4 编写程序代码 5 调试,编译代码并导出Jar包 6 上传Jar包到OBS和DLI OBS控制台 将生成的Spark
-
DLI表与OBS表的区别 - 数据湖探索 DLI
DLI表与OBS表的区别 DLI表表示数据存储在本服务内部,用户不感知数据存储路径。 OBS表表示数据存储在用户自己账户的OBS桶中,源数据文件由用户自己管理。 DLI表相较于OBS表提供了更多权限控制和缓存加速的功能,性能相较于外表性能更好,但是会收取存储费用。 父主题: 使用咨询
-
Flink Jar作业配置checkpoint保存到OBS - 数据湖探索 DLI
每隔40s保存checkpoint到OBS的${bucket}桶中的jobs/checkpoint/my_jar路径。 其中,最重要的是保存checkpoint路径。一般是将checkpoint存入OBS桶中,路径格式如下: 路径格式:obs://${bucket}/xxx/xxx/xxx
-
使用Hive语法创建OBS表 - 数据湖探索 DLI
file_format 是 OBS表存储格式,支持TEXTFILE, AVRO, ORC, SEQUENCEFILE, RCFILE, PARQUET table_comment 否 表描述。仅支持字符串常量。 obs_path 是 数据文件所在的OBS存储路径,推荐使用OBS并行文件系统存储。 格式