搜索_华为云

Spark jar 如何读取上传文件 - 数据湖探索 DLI

Spark jar 如何读取上传文件 Spark可以使用SparkFiles读取 –-file中提交上来的文件的本地路径，即：SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ Flink Jar作业上传配置文件操作流程自定义(JAR)作业支持上传配置文件。将配置文件通过程序包管理上传到DLI；在Flink jar作业的其他依赖文件参数中，选择创建的DLI程序包；在代码中通过ClassName

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Spar

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Flink作业管理界面对用户进行授权时提示用户不存在怎么办？ - 数据湖探索 DLI

Flink作业管理界面对用户进行授权时提示用户不存在怎么办？问题现象在“作业管理 > Flink作业”，对应作业“操作”列，选择“更多 > 权限管理”，对新用户进行授权操作时提示“No such user. userName:xxxx.”错误。解决方案以上问题可能是由于系统未能识别新用户信息。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？问题现象创建OBS外表，因为指定的OBS文件内容中某字段包含回车换行符导致表字段数据错误。例如，当前创建的OBS外表语句为： CREATE TABLE test06 (name string, id

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没有包含分

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Livy工具将Spark作业提交到DLI。将开发好的Spark作业程序jar包上传到OBS路径下。例如，本示例上传“spark-examples_2.11-XXXX.jar”到“obs://bucket/path”路径下。以root用户登录到安装DLI Livy工具的ECS服务器。执行curl命令通过DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
数据赋权（用户）（废弃） - 数据湖探索 DLI

数据赋权（用户）（废弃）功能介绍该API用于将数据库或数据表的数据权限赋给指定的其他用户。被赋权用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见权限策略和《统一身份认证服务用户指南》中的创建用户组。当前接口已废弃，不推荐使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

提交Spark作业将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据问题现象使用Flink作业输出流写入数据到了OBS中，通过该OBS文件路径创建的DLI表进行数据查询时，无法查询到数据。例如，使用如下Flink结果表将数据写入到OBS的“obs://obs-sink/car_infos”路径下。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
创建IAM用户并授权使用DLI - 数据湖探索 DLI

示例流程图1 给用户授权DLI权限流程创建用户组并授权在IAM控制台创建用户组，并授予DLI服务普通用户权限“DLI ReadOnlyAccess”。创建用户并加入用户组在IAM控制台创建用户，并将其加入1中创建的用户组。用户登录并验证权限使用新创建的用户登录控制台，切换至授权区域，验证权限：

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。通过管理控制台创建跨源连接请参考《数据湖探索用户指南》。通过A

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
pyspark样例代码 - 数据湖探索 DLI

提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

提交Spark作业将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
上传分组资源（废弃） - 数据湖探索 DLI

Strings 用户OBS对象路径列表，OBS对象路径为OBS对象URL。 kind 是 String 分组资源文件的类型。 jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。说明：上传的同一组资源包含

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
创建DLI程序包 - 数据湖探索 DLI

包类型支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件 File：用户文件 ModelFile：用户AI模型文件 OBS路径选择对应程序包的OBS路径。说明：程序包需提前上传至OBS服务中保存。只支持选择文件。分组设置可选择“已有分组”，“创建新分组”或“不分组”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。根据该验证方式，初步定位是因为文件数据量较大，文本编辑器无法全部读取。通过执行查询语句，查询O

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
程序包管理概述 - 数据湖探索 DLI

所有者上传程序包的用户名称。包类型程序包的类型。支持的包类型如下： JAR：用户jar文件。 PyFile：用户Python文件。 File：用户文件。 ModelFile：用户AI模型文件。状态创建程序包的状态。上传中（Uploading）：表示程序包正在上传。已成

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
什么是用户配额？ - 数据湖探索 DLI

什么是用户配额？配额是指云平台预先设定的资源使用限制，包括资源数量和容量等。设置配额是为了确保资源合理的分配和使用，避免资源过度集中和资源浪费。如果资源配额限制满足不了用户的使用需求，可以通过工单系统来提交您的申请，并告知您申请提高配额的理由。在通过审理之后，系统会更新您的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI资源配额类

总条数： 909

上一页
1
2
3
4
5
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark jar 如何读取上传文件 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

Flink作业管理界面对用户进行授权时提示用户不存在怎么办？ - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

数据赋权（用户）（废弃） - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

创建IAM用户并授权使用DLI - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

如何合并小文件 - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

什么是用户配额？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线