搜索_华为云

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

确认客户esdk-obs-java-3.1.3.jar的版本。确认是集群存在问题。处理步骤设置依赖关系provided。重启clusteragent应用集群升级后的配置。去掉OBS依赖，否则checkpoint会写不进OBS。父主题： Flink Jar作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
配置Flink作业权限 - 数据湖探索 DLI

配置Flink作业权限 Flink作业权限操作场景针对不同用户，可以通过权限设置分配不同的作业，不同用户之间的作业效率互不影响，保障作业性能。管理员用户和作业的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其作业权限。给新用户设置作业权限时，该用户所在用户组的所属区域需具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

在DLI管理控制台的“全局配置 > 作业配置” 页查看对应OBS桶是否被设置为了DLI日志桶，日志桶不能用于DLI的其他业务功能中。确认桶是否应用于其他业务功能。如果是，您可以在DLI管理控制台页面更改作业配置，选择其他未被占用的OBS桶用于DLI日志存储。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
pyspark样例代码 - 数据湖探索 DLI

sql import SparkSession 创建会话 1 sparkSession = SparkSession.builder.appName("datasource-opentsdb").getOrCreate() 创建DLI跨源访问 OpenTSDB的关联表 1 2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
Python开发环境配置 - 数据湖探索 DLI

检验是否配置成功，运行cmd ，输入 python。运行结果，请参见图1，显示版本信息，则说明安装和配置成功。图1 检验配置是否成功 python安装应用包时出现错误类似错误“error: Microsoft Visual C++ xx.x is required. Get it with Build

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

extensions", "org.apache.spark.sql.hudi.HoodieSparkSessionExtension") .appName("HudiIncrementalReadDemo") .getOrCreate(); // 1. 通过Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

spark.sql.SparkSession; 创建会话 1 sparkSession = SparkSession.builder().appName("datasource-opentsdb").getOrCreate(); 通过SQL API 访问创建DLI跨源访问MRS

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

out_file_name = "D://test-data_result_1" sc = SparkContext("local","wordcount app") sc._jsc.hadoopConfiguration().set("fs.obs.access.key", "myak") sc._jsc

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

userData/kafka-sink.conf / path = /opt/data1/hadoop/tmp/usercache/omm/appcache/application_xxx_0015/container_xxx_0015_01_000002/userData/client.truststore

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
CREATE TABLE AS - 数据湖探索 DLI
CREATE TABLE AS - 数据湖探索 DLI

mp' TBLPROPERTIES (orc_bloom_filter_fpp = 0.3, orc_compress = 'SNAPPY', orc_compress_size = 6710422, orc_bloom_filter_columns = 'corderstatus

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

SparkSession; 创建会话 1 SparkSession sparkSession = SparkSession.builder().appName("datasource-dws").getOrCreate(); 通过SQL API 访问数据源创建DLI跨源访问DWS的关联表，填写连接参数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
执行作业的用户数据库和表权限不足导致作业运行失败 - 数据湖探索 DLI

MetaException(message:Permission denied for resource: databases.xxx,action:SPARK_APP_ACCESS_META) 解决方案需要给执行作业的用户赋数据库的操作权限，具体操作参考如下：在DLI管理控制台左侧，单击“数据管理”>“库表管理”。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Spark jar 如何读取上传文件 - 数据湖探索 DLI

main(args:Array[String]): Unit = { val spark = SparkSession.builder .appName("SparkTest") .getOrCreate() // driver 获取上传文件 println(SparkFiles

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

SELECT” 错误。问题示例语句参考如下： CREATE TABLE testcsvdatasource (name string, id int) USING csv OPTIONS (path "obs://dli-test-021/data/test.csv"); 问题

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

PG_TERMINATE_BACKEND(pid) from pg_stat_activity WHERE state='idle'; 检查应用程序是否未主动释放连接，导致连接残留。建议优化代码，合理释放连接。在GaussDB(DWS) 控制台设置会话闲置超时时长session_

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

SparkSession; 创建会话 1 SparkSession sparkSession = SparkSession.builder().appName("datasource-rds").getOrCreate(); 通过SQL API 访问创建DLI跨源访问RDS的关联表，填写连接参数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x版本中使用Mesos作为资源管理器，升级到Spark 3.3.x后，你需要考虑切换到其他资源管理器。 Spark3.3.x会在应用程序自行终止时删除K8s driver 说明：Spark3.3.x会在应用程序自行终止时删除K8s driver。升级引擎版本后是否对作业有影响：功能增强，升级到Spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

x及以上版本只能选择OBS路径下的程序包。主类（--class）输入主类名称。当应用程序类型为“.jar”时，主类名称不能为空。应用程序参数用户自定义参数，多个参数请以Enter键分隔。应用程序参数支持全局变量替换。例如，在“全局配置”>“全局变量”中新增全局变量key为

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

在“作业管理”>“Flink作业”页面，单击对应的作业名称，进入作业详情页面，单击“运行日志”可以查看实时日志。运行失败且超过1分钟(日志转储周期1分钟)，会在application_xx下生成运行日志。另外，由于DLI服务端已经内置了Flink的依赖包，并且基于开源社区版本做了安全加固。为了避免依赖

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
DLI内置依赖包 - 数据湖探索 DLI

jetty-util-ajax-9.4.31.v20200723.jar snappy-java-1.1.7.5.jar curator-framework-4.2.0.jar jetty-webapp-9.4.31.v20200723.jar spark-catalyst_2.11-2

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包

总条数： 811

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

CREATE TABLE AS - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

执行作业的用户数据库和表权限不足导致作业运行失败 - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线