搜索_华为云

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。根据该验证方式，初步定位是因为文件数据量较大，文本编辑器无法全部读取。通过执行查询语句，查询OBS数据进一步进行确认，查询结果确认数据量正确。因此，该问题为验证方式不正确造成。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Key），需要具备访问OBS对应桶的权限。 spark.hadoop.fs.obs.security.provider 是无 String OBS AKSK认证机制，使用DEW服务中的CSMS凭证管理，获取OBS的AK、SK。默认取值为com.dli.provider.UserObsBasicCredentialProvider

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？问题现象手动在OBS表的分区目录下上传了分区数据，但是在SQL编辑器中查询该表新增的分区数据时却查询不到。解决方案手动添加分区数据后，需要刷新OBS表的元数据信息。具体操作如下： MSCK REPAIR TABLE

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
更新表分区信息（只支持OBS表） - 数据湖探索 DLI

参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path OBS存储路径。注意事项该命令的主要应用场景是针对分区表，如当手动在OBS上面添加分区目录时，再通过上述命令将该新增的分区信息刷新到元数据库中，通过“SHOW PARTITIONS

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
导入数据（废弃） - 数据湖探索 DLI

功能介绍该API用于将数据从文件导入DLI或OBS表，目前仅支持将OBS上的数据导入DLI或OBS中。当前接口已废弃，不推荐使用。该API为异步操作。导入数据时，可选择已存在的OBS桶路径或新建OBS桶路径，但只能指定一个OBS桶路径。若需新建OBS桶，需遵守以下命名规则：

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

时，在connector中设置账号、密码等属性。 Flink Jar 使用DEW获取访问凭证读写OBS 访问OBS的AKSK为例介绍Flink Jar使用DEW获取访问凭证读写OBS的操作指导。用户获取Flink作业委托临时凭证 DLI提供了一个通用接口，可用于获取用户在启动F

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误问题现象 Spark程序访问OBS数据时上报如下错误。 Caused by: com.obs.services.exception.ObsException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表）功能描述指定筛选条件删除分区表的一个或多个分区。注意事项该命令仅支持操作OBS表，不支持对DLI表进行操作。所要删除分区的表必须是已经存在的表，否则会出错。所要删除的分区必须是已经存在的，否则会出错，可通过语句中添加“IF EXISTS”避免该错误。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 DLI Flink作业提交或运行失败时，对应生成的作业日志保存方式，包含以下三种情况：提交失败，只会在submit-client下生成提交日志。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
对已创建的上传作业进行鉴权（废弃） - 数据湖探索 DLI

对已创建的上传作业进行鉴权（废弃）功能介绍该API用于检查已创建的上传作业是否合法，并授权合法作业上传数据至DLI。当前接口已废弃，不推荐使用。 URI URI格式： POST /v1.0/{project_id}/uploader/authentication 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 上传数据相关API（废弃）
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

path = "obs://obs-sink/car_infos", encode = "parquet", ak = "{{myAk}}", sk = "{{mySk}}" ); 数据最终在OBS中的存储目录结构为：obs://obs-sink/car

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
上传file类型分组资源（废弃） - 数据湖探索 DLI

"READY"表示资源包已上传。 "FAILED"表示资源包上传失败。 underlying_name 否 String 资源包在队列中的名字。 is_async 否 Boolean 是否异步上传资源包。请求示例从OBS上传用户文件至DLI，并定义分组名称为gatk。 { "paths":

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

"READY"表示资源包已上传。 "FAILED"表示资源包上传失败。 underlying_name 否 String 资源包在队列中的名字。 is_async 否 Boolean 是否异步上传资源包。请求示例从OBS上传python文件至DLI，并定义分组名称为gatk。 {

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
上传jar类型分组资源（废弃） - 数据湖探索 DLI

"READY"表示资源包已上传。 "FAILED"表示资源包上传失败。 underlying_name 否 String 资源包在队列中的名字。 is_async 否 Boolean 是否异步上传资源包。请求示例从OBS上传jar包至DLI，并定义分组名称为gatk。 { "paths":

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
SQL作业运行慢如何定位 - 数据湖探索 DLI

container_xxx_000001归档日志文件夹示例 Spark Jar作业： Spark Jar作业的归档日志文件夹以“batch”开头。图4 Spark Jar作业归档日志文件夹名示例进入归档日志文件目录，在归档日志文件目录下，下载“gc.log.*”日志。打开已下载的“gc

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

步骤1：创建并上传数据创建CSV数据，例如，如图2所示test.csv：图2 创建test.csv文件在OBS上建桶obs-csv-parquet，并将test.csv文件上传至OBS，如图3所示：图3 上传CSV数据至OBS 在OBS上创建一个新的桶obs-parque

帮助中心 > 数据湖探索 DLI > 最佳实践
导出数据（废弃） - 数据湖探索 DLI

导出数据（废弃）功能介绍该API用于从DLI表中导出数据到文件。该API为异步操作。目前只支持从DLI表导出数据到OBS中，且导出的路径必须指定到文件夹级别。OBS路径中不支持逗号，且其中的桶名不能以正则格式“.[0-9]+(.*)”结尾，即，若桶名包含“.”，则最后一个“

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
导出查询结果 - 数据湖探索 DLI

导出查询结果功能介绍该API用于将SQL语句的查询结果导出到OBS对象存储中，只支持导出“QUERY”类型作业的查询结果。该API为异步操作。目前只支持导出数据到OBS中，且导出的路径必须指定到文件夹级别。OBS路径中不支持逗号，且其中的桶名不能以正则格式“.[0-9]+(

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
上传数据相关API（废弃） - 数据湖探索 DLI

上传数据相关API（废弃）对已创建的上传作业进行鉴权（废弃）父主题：历史API

帮助中心 > 数据湖探索 DLI > API参考 > 历史API
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator import

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 753

上一页
1
2
3
4
5
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

更新表分区信息（只支持OBS表） - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

对已创建的上传作业进行鉴权（废弃） - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

上传file类型分组资源（废弃） - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

上传jar类型分组资源（废弃） - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

导出数据（废弃） - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

上传数据相关API（废弃） - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线