搜索_华为云

导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

指定错误记录存储目录。注意事项导入OBS表时，创建OBS表时指定的路径必须是文件夹，若建表路径是文件将导致导入数据失败。仅支持导入位于OBS路径上的原始数据。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。导入数据时只能指定一个路径，路径中不能包含逗号。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？问题现象使用DLI插入数据到OBS临时表文件，数据量有差异。根因分析出现该问题可能原因如下：作业执行过程中，读取数据量错误。验证数据量的方式不正确。通常在执行插入数据操作后，如需确认插入数据量是否正确，建议通过查询语句进行查询。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
将OBS数据导入至DLI - 数据湖探索 DLI

将OBS数据导入至DLI 本节操作介绍将OBS上的数据导入到DLI控制台的表中。注意事项导入数据时只能指定一个路径，路径中不能包含逗号。如果将CSV格式数据导入分区表，需在数据源中将分区列放在最后一列。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
导入数据（废弃） - 数据湖探索 DLI

partition_spec 否 Object 表示需要导入到哪个分区。不配置表示动态导入整表数据，导入的数据需要包含分区列的数据；如果导入时，配置所有分区信息，则表示导入数据到指定分区，导入的数据不能包含分区列的数据；如果导入时，配置了部分分区信息，而导入的数据必须包含非指定的分区数据，不能

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
SDK的获取与安装 - 数据湖探索 DLI

您可以通过以下两种方式安装Java SDK。导入Maven依赖，适用于使用Maven管理的Java项目。具体操作请参考方法一：通过Maven安装DLI SDK依赖。在集成开发环境中导入JAR文件，适用于使用Eclipse作为集成开发环境的项目。具体操作请参考方法二：通过在Eclipse中导入JAR文件安装SDK。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？在DLI执行作业时，为了避免因字符编码不一致导致的乱码问题，建议您统一数据源的编码格式。 DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSO

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
导入Flink作业 - 数据湖探索 DLI
导入Flink作业 - 数据湖探索 DLI

参数类型说明 zip_file 是 String 从OBS上导入的作业zip文件路径，支持填写文件夹，导入文件夹下的所有zip文件。说明：文件夹中只能包含zip文件。 is_cover 否 Boolean 如果导入的作业与服务已有的作业同名，是否覆盖服务中已有的作业。响应消息

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

OBS表压缩率较高怎么办？当您在提交导入数据到DLI表的作业时，如果遇到Parquet/Orc格式的OBS表对应的文件压缩率较高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.ma

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI是否支持导入其他租户共享OBS桶的数据？ - 数据湖探索 DLI

DLI是否支持导入其他租户共享OBS桶的数据？ DLI支持将同一个租户下子账户共享OBS桶中的数据导入，但是租户级别共享OBS桶中的数据无法导入。 DLI不支持导入其他租户共享的OBS桶中的数据，主要是为了确保数据的安全性和数据隔离。对于需要跨租户共享和分析数据的场景，建议先将

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
导入Flink作业保存点 - 数据湖探索 DLI

导入Flink作业保存点功能介绍导入Flink作业保存点。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v1.0/{project_id}/str

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API
增强型跨源连接类 - 数据湖探索 DLI

failure错误怎么办？跨源访问MRS HBase，连接超时，日志未打印错误怎么办？ DLI跨源连接报错找不到子网怎么办？跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？创建RDS跨源表提示空指针错误怎么办？对跨源DWS表执行insert

帮助中心 > 数据湖探索 DLI > 常见问题
通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException - 数据湖探索 DLI

通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException 问题现象客户通过DLI跨源表向CloudTable Hbase导入数据，原始数据：HBASE表，一个列簇，一个rowkey运行一个亿的模拟数据，数据量为9.76GB。导入1000W条数据后作业失败。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
DLI数据库和表类 - 数据湖探索 DLI

为什么在DLI控制台中查询不到表？ OBS表压缩率较高怎么办？字符码不一致导致数据乱码怎么办？删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？

帮助中心 > 数据湖探索 DLI > 常见问题
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

在提交导入作业前，可选择设置导入数据的格式，如样例所示，调用ImportJob对象的setStorageType接口设置数据存储类型为csv，数据的具体格式通过调用ImportJob对象的setCsvFormatInfo接口进行设置。在提交导入作业前，可选择设置导入数据的分区

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

作业相关完整样例代码和依赖包说明请参考：Python SDK概述。导入数据 DLI提供导入数据的接口。您可以使用该接口将存储在OBS中的数据导入到已创建的DLI表中。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
与其他云服务的关系 - 数据湖探索 DLI

Service）作为DLI的数据来源及数据存储，与DLI配合一起使用，关系有如下四种。数据来源：使用DLI服务提供API，将OBS对应路径的数据导入到DLI。具体API请参考《导入数据》。存储数据：DLI中支持创建OBS表，该类型表在DLI服务中只有元数据，实际数据在该表对应的OBS路径中。创建O

帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 203

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导入数据 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

导入Flink作业 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

DLI是否支持导入其他租户共享OBS桶的数据？ - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

导入Flink作业保存点 - 数据湖探索 DLI

增强型跨源连接类 - 数据湖探索 DLI

通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DLI数据库和表类 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线