搜索_华为云

Spark jar 如何读取上传文件 - 数据湖探索 DLI

Spark jar 如何读取上传文件 Spark可以使用SparkFiles读取 –-file中提交上来的文件的本地路径，即：SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ Flink Jar作业上传配置文件操作流程自定义(JAR)作业支持上传配置文件。将配置文件通过程序包管理上传到DLI；在Flink jar作业的其他依赖文件参数中，选择创建的DLI程序包；在代码中通过ClassName

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Spar

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
上传file类型分组资源（废弃） - 数据湖探索 DLI

"READY"表示资源包已上传。 "FAILED"表示资源包上传失败。 underlying_name 否 String 资源包在队列中的名字。 is_async 否 Boolean 是否异步上传资源包。请求示例从OBS上传用户文件至DLI，并定义分组名称为gatk。 { "paths":

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
上传数据相关API（废弃） - 数据湖探索 DLI

上传数据相关API（废弃）对已创建的上传作业进行鉴权（废弃）父主题：历史API

帮助中心 > 数据湖探索 DLI > API参考 > 历史API
Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据问题现象使用Flink作业输出流写入数据到了OBS中，通过该OBS文件路径创建的DLI表进行数据查询时，无法查询到数据。例如，使用如下Flink结果表将数据写入到OBS的“obs://obs-sink/car_infos”路径下。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统问题现象客户执行Flink Jar作业，通过设置checkpoint存储在OBS桶中，作业一直提交失败，并伴有报错提交日志，提示OBS桶名不合法。原因分析确认OBS桶名是否正确。确认所用AKSK是否有权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
对已创建的上传作业进行鉴权（废弃） - 数据湖探索 DLI

对已创建的上传作业进行鉴权（废弃）功能介绍该API用于检查已创建的上传作业是否合法，并授权合法作业上传数据至DLI。当前接口已废弃，不推荐使用。 URI URI格式： POST /v1.0/{project_id}/uploader/authentication 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 上传数据相关API（废弃）
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

"READY"表示资源包已上传。 "FAILED"表示资源包上传失败。 underlying_name 否 String 资源包在队列中的名字。 is_async 否 Boolean 是否异步上传资源包。请求示例从OBS上传python文件至DLI，并定义分组名称为gatk。 {

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
上传分组资源（废弃） - 数据湖探索 DLI

kind 是 String 分组资源文件的类型。 jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。说明：上传的同一组资源包含不同文件类型时，均选择“file”类型作为这次上传文件的类型。 group 是 String

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没有包含分

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
SQL作业访问报错：File not Found - 数据湖探索 DLI

执行SQL作业访问报错：File not Found。可能原因可能由于文件路径错误或文件不存在导致系统无法找指定文件路径或文件。文件被占用。解决措施检查文件路径、文件名。检查文件的路径是否正确，包括目录名称和文件名。文件被占用文件被占用导致的文件报错找不到，一般是读写冲突产生的，建议查询SQ

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？问题现象创建OBS外表，因为指定的OBS文件内容中某字段包含回车换行符导致表字段数据错误。例如，当前创建的OBS外表语句为： CREATE TABLE test06 (name string, id

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

单价*CU数*小时数。步骤1：创建并上传数据创建CSV数据，例如，如图2所示test.csv：图2 创建test.csv文件在OBS上建桶obs-csv-parquet，并将test.csv文件上传至OBS，如图3所示：图3 上传CSV数据至OBS 在OBS上创建一个新

 帮助中心 > 数据湖探索 DLI > 最佳实践
程序包管理概述 - 数据湖探索 DLI

所有者上传程序包的用户名称。包类型程序包的类型。支持的包类型如下： JAR：用户jar文件。 PyFile：用户Python文件。 File：用户文件。 ModelFile：用户AI模型文件。状态创建程序包的状态。上传中（Uploading）：表示程序包正在上传。已成

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
创建DLI程序包 - 数据湖探索 DLI

支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件 File：用户文件 ModelFile：用户AI模型文件 OBS路径选择对应程序包的OBS路径。说明：程序包需提前上传至OBS服务中保存。只支持选择文件。分组设置可选择“已有分组”，“创建新分组”或“不分组”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

若为true，则表示输出数据到taskmanager的error文件中。若为false，则表示输出数据到taskmanager的out中。示例从kafka中读取数据输出到taskmanager的out文件中，可以在taskmanager的out文件中看到输出结果。 create table kafkaSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
上传jar类型分组资源（废弃） - 数据湖探索 DLI

String 资源模块类型。 jar：用户jar文件; pyFile：用户python文件; file：用户文件。表4 details参数说明参数名称是否必选参数类型说明 create_time 否 Long 资源包上传的unix时间。是单位为“毫秒”的时间戳。 update_time

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

OBS路径：选择1.aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 617

上一页
1
2
3
4
5
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark jar 如何读取上传文件 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

如何合并小文件 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

上传file类型分组资源（废弃） - 数据湖探索 DLI

上传数据相关API（废弃） - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

对已创建的上传作业进行鉴权（废弃） - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

SQL作业访问报错：File not Found - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

上传jar类型分组资源（废弃） - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线