搜索_华为云

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误问题现象 Spark程序访问OBS数据时上报如下错误。 Caused by: com.obs.services.exception.ObsException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Spark 3.3.1版本说明 - 数据湖探索 DLI

Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
SQL作业访问报错：DLI.0003: AccessControlException XXX - 数据湖探索 DLI

SQL作业访问报错：DLI.0003: AccessControlException XXX。解决措施请检查OBS桶权限，确保账号有权限访问报错信息中提到的OBS桶。如果没有，需要联系OBS桶的管理员添加桶的访问权限。父主题： SQL作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
清空数据 - 数据湖探索 DLI
清空数据 - 数据湖探索 DLI

需要执行Truncate命令的DLI表或者OBS表的名称。 partcol1 需要删除的DLI表或者OBS表的分区名称。注意事项只支持清除DLI表或者OBS表的数据。示例 1 truncate table test PARTITION (class = 'test'); 父主题：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
在Spark SQL作业中使用UDF - 数据湖探索 DLI

参考操作步骤说明，编写UDF函数代码。 2 编写UDF函数代码 3 调试，编译代码并导出Jar包 4 上传Jar包到OBS OBS控制台将生成的UDF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDF函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

参考操作步骤说明，编写UDTF函数代码。 2 编写UDTF函数代码 3 调试，编译代码并导出Jar包 4 上传Jar包到OBS OBS控制台将生成的UDTF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDTF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDTF函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
数据湖探索简介 - 数据湖探索 DLI

具体内容请参见《数据湖探索开发指南》。存算分离用户将数据存储到OBS后，DLI可以直接和OBS对接进行数据分析。存算分离的架构下，使得存储资源和计算资源可以分开申请和计费，降低了成本并提高了资源利用率。存算分离场景下，DLI支持OBS在创建桶时数据冗余策略选择单AZ或者多AZ存储，两种存储策略区别如下：

帮助中心 > 数据湖探索 DLI > 产品介绍
在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

x访问元数据时，DataSource语法创建avro类型的OBS表创建失败问题描述使用Spark访问元数据时，DataSource语法创建avro类型的OBS表创建失败。图1 avro类型的OBS创建失败根因分析当前Spark2.3.x不支持创建avro类型的OBS表，Spark2.4.x及以上的版本支持avro类型的OBS表。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Flink 1.15 Jar 读取用户自定义配置文件的方式相比Flink 1.12存在差异。详细操作说明请参考使用Flink Jar写入数据到OBS开发指南。 Flink 1.15 Jar 程序，采用反向类加载机制（child-first），可通过优化参数设置某些依赖包由父类加载器加载：parent

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

false Boolean 该值只能为true或false，默认为false。如果为true，则表示输出数据到taskmanager的error文件中。如果为false，则表示输出数据到taskmanager的out中。 sink.parallelism 否无 Integer 为Pr

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

false Boolean 该值只能为true或false，默认为false。若为true，则表示输出数据到taskmanager的error文件中。若为false，则表示输出数据到taskmanager的out中。示例参考创建Flink OpenSource作业，创建flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
SQL作业访问外表报错：DLI.0001: org.apache.hadoop.security.AccessControlException: verifyBucketExists on {{桶名}}: status [403] - 数据湖探索 DLI

verifyBucketExists on {{桶名}}: status [403]。解决措施请检查OBS桶权限，确保账号有权限访问报错信息中提到的OBS桶。如果没有，需要联系OBS桶的管理员添加桶的访问权限。父主题： SQL作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
在DLI控制台配置数据库权限 - 数据湖探索 DLI

如果需要查看管理员或者其他用户账号下的数据库，需要对当前用户授权（显示权限），具体请参考常用操作与系统权限关系。数据库和表赋权对象具有层级关系，用户赋予上一层级的权限会自动继承到下一层级对象上，层级关系为：数据库>表>列。数据库所有者、表所有者、被赋予“赋权权限”的用户都可以对数据库和表赋权。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
pyspark样例代码 - 数据湖探索 DLI

sparkSession.conf.set("fs.obs.access.key", ak) sparkSession.conf.set("fs.obs.secret.key", sk) sparkSession.conf.set("fs.obs.endpoint", enpoint) sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
创建批处理作业 - 数据湖探索 DLI

用户已上传到DLI资源管理系统的类型为jar的程序包名。也支持指定OBS路径，例如：obs://桶名/包名。 pyFiles 否 Array of Strings 用户已上传到DLI资源管理系统的类型为pyFile的资源包名。也支持指定OBS路径，例如：obs://桶名/包名。 files 否 Array

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

SDK概述。创建OBS表 DLI提供创建OBS表的接口。您可以使用该接口创建数据存储在OBS的表。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 def create_obs_tbl(dli_client

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
CREATE TABLE AS SELECT - 数据湖探索 DLI

price, 1000 as dt; 从parquet表加载数据到hudi表 # 创建parquet表 create table parquet_mngd using parquet options(path=’obs://bucket/path/parquet_dataset/*

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
file - 数据湖探索 DLI
file - 数据湖探索 DLI

file_path 格式无。说明文件路径，该路径是OBS路径。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
Bitwise函数 - 数据湖探索 DLI
Bitwise函数 - 数据湖探索 DLI

[same as value] 描述：返回value的算术右移值，当shift小于64位时，返回结果与bitwise_right_shift一样，当移动位数达到或者超过64位时，value是正数时返回0，负数时返回-1： SELECT bitwise_right_shift_arithmetic(

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1 Flink作业配置参数对于Flink Jar作业，您需要在代码中开启Checkpoint，同时如果

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类

总条数： 756

上一页
1
...
27
28
29
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

SQL作业访问报错：DLI.0003: AccessControlException XXX - 数据湖探索 DLI

清空数据 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Print - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

SQL作业访问外表报错：DLI.0001: org.apache.hadoop.security.AccessControlException: verifyBucketExists on {{桶名}}: status [403] - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

file - 数据湖探索 DLI

Bitwise函数 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线