搜索_华为云

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

OBS表压缩率较高怎么办？当您在提交导入数据到DLI表的作业时，如果遇到Parquet/Orc格式的OBS表对应的文件压缩率较高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.ma

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
查询作业执行进度信息 - 数据湖探索 DLI

功能介绍该API用于获取作业执行进度信息，如果作业正在执行，可以获取到子作业的信息，如果作业刚开始或者已经结束，则无法获取到子作业信息。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v1/{project_id}/jobs/{job_id}/progress

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

path = "obs://obs-sink/car_infos", encode = "parquet", ak = "{{myAk}}", sk = "{{mySk}}" ); 数据最终在OBS中的存储目录结构为：obs://obs-sink/car

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
获取账号ID - 数据湖探索 DLI
获取账号ID - 数据湖探索 DLI

获取账号ID 在调用接口的时候，部分URL中需要填入账号ID（domain-id），所以需要先在管理控制台上获取到账号ID。账号ID获取步骤如下：登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在“API凭证”页面查看账号ID。图1 获取账号ID

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误问题现象 Spark程序访问OBS数据时上报如下错误。 Caused by: com.obs.services.exception.ObsException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表）功能描述指定筛选条件删除分区表的一个或多个分区。注意事项该命令仅支持操作OBS表，不支持对DLI表进行操作。所要删除分区的表必须是已经存在的表，否则会出错。所要删除的分区必须是已经存在的，否则会出错，可通过语句中添加“IF EXISTS”避免该错误。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 DLI Flink作业提交或运行失败时，对应生成的作业日志保存方式，包含以下三种情况：提交失败，只会在submit-client下生成提交日志。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

获取项目ID 操作场景在调用接口的时候，部分URL中需要填入项目ID，所以需要获取到项目ID。有如下两种获取方式：调用API获取项目ID 从控制台获取项目ID 调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目信息API获取。获取项目ID的接口为“GET ht

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表如果需要关联OBS桶中嵌套的JSON格式数据，可以使用异步模式创建表。以下是一个示例的建表语句，展示了如何使用 JSON 格式选项来指定 OBS 中的路径： create table tb1 using json options(path

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
SDK的获取与安装 - 数据湖探索 DLI

发环境的项目。具体操作请参考方法二：通过在Eclipse中导入JAR文件安装SDK。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。表1 目录结构名称说明 jars SDK及其依赖的jar包。 maven-install

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Flink作业如何保存作业日志？ - 数据湖探索 DLI

保存到OBS。勾选“保存作业日志”参数后，需配置“OBS桶”参数，选择OBS桶用于保存用户作业日志信息。如果选择的OBS桶是未授权状态，需要单击“OBS授权”。日志信息的保存路径为：“桶名/jobs/logs/作业id开头的目录”。其中，“桶名”可以自定义。“/jobs/logs/作业id开头的目录”为固定格式。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
导入数据（废弃） - 数据湖探索 DLI

该API用于将数据从文件导入DLI或OBS表，目前仅支持将OBS上的数据导入DLI或OBS中。当前接口已废弃，不推荐使用。该API为异步操作。导入数据时，可选择已存在的OBS桶路径或新建OBS桶路径，但只能指定一个OBS桶路径。若需新建OBS桶，需遵守以下命名规则：需全局唯一，不能与已有的任何桶名称重复。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] 该报错信息可能是由于OBS桶被设置为了DLI日志桶，而日志桶不能用于DLI的其他业务功能。您可以按以下操作步骤进行查询：检查该OBS桶是否被设置为了DLI日志桶。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
SDK获取与安装 - 数据湖探索 DLI

SDK获取与安装 Python SDK安装方式本节操作介绍安装Python SDK的操作指导。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。 “dli-sdk-python-x.x.x.zip”压缩包，解压后目录结构如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
数据迁移与传输方式概述 - 数据湖探索 DLI

数据迁移与传输方式概述导入数据至OBS DLI支持在不迁移数据的情况下，直接访问OBS中存储的数据进行查询分析。您只需将本地数据导入OBS即可开始使用DLI进行数据分析。导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
值获取函数 - 数据湖探索 DLI
值获取函数 - 数据湖探索 DLI

值获取函数表1 值获取函数 SQL函数描述 tableName.compositeType.field 按名称从 Flink 复合类型（例如，Tuple，POJO）返回字段的值。 tableName.compositeType.* 返回 Flink 复合类型（例如，Tuple

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator import

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询所有作业 - 数据湖探索 DLI

URI格式： GET /v1.0/{project_id}/jobs 参数说明表1 URI 参数参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。表2 query参数参数名称是否必选参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
SQL作业访问外表报错：DLI.0001: org.apache.hadoop.security.AccessControlException: verifyBucketExists on {{桶名}}: status [403] - 数据湖探索 DLI

verifyBucketExists on {{桶名}}: status [403]。解决措施请检查OBS桶权限，确保账号有权限访问报错信息中提到的OBS桶。如果没有，需要联系OBS桶的管理员添加桶的访问权限。父主题： SQL作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

SDK概述。创建OBS表 DLI提供创建OBS表的接口。您可以使用该接口创建数据存储在OBS的表。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 def create_obs_tbl(dli_client

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关

总条数： 980

上一页
1
2
3
4
5
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

获取账号ID - 数据湖探索 DLI

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

Flink作业如何保存作业日志？ - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

值获取函数 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

SQL作业访问外表报错：DLI.0001: org.apache.hadoop.security.AccessControlException: verifyBucketExists on {{桶名}}: status [403] - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线