搜索_华为云

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

hadoop.fs.obs.OBSIOException错误问题现象在DataArts Studio上运行DLI SQL脚本，执行结果的运行日志显示语句执行失败，错误信息为： DLI.0999: RuntimeException: org.apache.hadoop.fs.obs

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
开启或关闭数据多版本 - 数据湖探索 DLI

开启或关闭数据多版本功能描述 DLI提供多版本功能，用于数据的备份与恢复。开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据。其他多版本SQL语法请参考多版本备份恢复数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
SDK的获取与安装 - 数据湖探索 DLI

发环境的项目。具体操作请参考方法二：通过在Eclipse中导入JAR文件安装SDK。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。表1 目录结构名称说明 jars SDK及其依赖的jar包。 maven-install

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
创建指定地址连通性测试请求 - 数据湖探索 DLI

系统提示信息，执行成功时，信息可能为空。 task_id 是 Integer 请求id。请求示例测试队列与该地址“iam.xxx.com:443”的连通性。 { "address": "iam.xxx.com:443" } 响应示例 { "is_success": true

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
查询组内资源包（废弃） - 数据湖探索 DLI

响应参数参数名称参数类型说明 create_time Long 资源包上传的unix时间。是单位为“毫秒”的时间戳。 update_time Long 更新已上传资源包的unix时间。是单位为“毫秒”的时间戳。 resource_type String 资源类型。 resource_name

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
创建CSS类型跨源认证 - 数据湖探索 DLI

安全集群的登录密码。 Certificate路径上传“安全证书”的OBS路径。即步骤2的OBS桶地址。图1 创建认证信息-CSS 访问CSS的表。跨源认证创建成功后，在创建访问CSS的表时只需关联跨源认证即可安全访问数据源。例如在使用Spark SQL来创建访问CSS的表时使用es

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

在提交导入作业前，可选择设置导入数据的格式，如样例所示，调用ImportJob对象的setStorageType接口设置数据存储类型为csv，数据的具体格式通过调用ImportJob对象的setCsvFormatInfo接口进行设置。在提交导入作业前，可选择设置导入数据的分区并配置是否是ove

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
查看队列的使用者（废弃） - 数据湖探索 DLI

查看队列的使用者（废弃）功能介绍该API用于查询可以使用的指定队列的所有用户名称。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v1.0/{project_id}/queues/{queue_name}/users

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
查询所有表（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。 database_name 是查看表所在的数据库名称。 keyword 否过滤表名称的关键词。 with-detail 否是否获取表的详细信息（所有者，size等）。请求消息无请求参数。响应消息表2 响应参数参数是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 表相关API（废弃）
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

首进入提交SQL作业的界面。提交SQL作业时需要选择支持Hudi的Spark SQL队列。创建一张Hudi表：将如下的建表语句粘贴至DLI SQL编辑器的输入区域，修改 LOCATION，执行引擎选择Spark，配置队列，数据目录，数据库，随后点击右上角的执行按钮，提交作业。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

在使用join进行多表关联查询时，不管表数据量大小，join时都需要指定on条件来减少多表关联的数据量，从而减轻队列的负荷，提升查询效率。例如，问题现象中的问题语句可以根据业务场景，在join时通过指定on条件来进行优化，这样会极大减少关联查询的结果集，提升查询效率。 select case

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
查询所有全局变量 - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。表2 query参数说明参数名称是否必选参数类型说明 limit 否 Integer 每页显示的返回信息的个数，默认值为“100”。 offset 否 Integer 偏移量，默认值为“0”。请求消息无请求参数。响应消息表3 响应参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
配置Hudi数据列默认值 - 数据湖探索 DLI

历史数据的默认值与列第一次设置的默认值一致，多次修改列的默认值不会影响历史数据的查询结果。设置默认值后rollback不能回滚默认值配置。 Spark SQL暂不支持查看列默认值信息，可以通过执行show create table SQL查看。不支持默认缺省列的写入方式，写入时必须指定列名。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
重启/扩容/缩容队列 - 数据湖探索 DLI

重启/扩容/缩容队列功能介绍该API用于重新启动队列、扩容队列、缩容队列。只有SQL类型的队列支持重启，且重启的时候队列的状态必须是可用状态（执行SQL作业成功后队列状态才是可用状态）。调试您可以在API Explorer中调试该接口。 URI URI格式： PUT /v1

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
查询作业执行计划 - 数据湖探索 DLI

否 String 请求是否成功。 message 否 String 消息内容。 execute_graph 否 Object 查询作业计划的响应参数。具体请参考表3。表3 execute_graph参数说明参数名称是否可选参数类型说明 jid 否 String flink作业id。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
边缘Flink作业Action回调（废弃） - 数据湖探索 DLI

边缘Flink作业Action回调（废弃）功能介绍该API用于处理IEF Flink作业action回调信息。 DLI不再支持边缘作业场景的API调用。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1/{project_id}/edgesrv/messages

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > IEF相关API（废弃）
本文样例表数据准备 - 数据湖探索 DLI

-- 1 | {col2=2, col3=test} --创建一个名为web的schema： CREATE SCHEMA web; --在hive 数据源下创建一个名为sales的schema： CREATE SCHEMA hive.sales; --创建一个名为traffic，如果不存在的话：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > 附录
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

（不使用Catalog的场景）：这里的sink表通过创建临时表指向Hudi表路径来写入数据，同时在表参数中配置hive_sync相关参数，实时同步元数据至由DLI提供的元数据服务。（具体参数详见Flink参数一节）请将作业中sink表的path参数修改为希望保存hudi表的obs路径。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
上传jar类型分组资源（废弃） - 数据湖探索 DLI

of strings 该模块包含的资源包名列表。 details 否 Array of body 分组资源包的详细信息。具体请参考表4。 create_time 否 Long 模块上传的unix时间戳。 update_time 否 Long 模块更新的unix时间戳。 is_async

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
禁止或恢复表的生命周期 - 数据湖探索 DLI

否禁止表或指定分区的生命周期功能。禁止表本身及其所有分区被生命周期回收，优先级高于恢复表分区生命周期。即当使用禁止表或指定分区的生命周期功能时，设置待禁止或恢复生命周期的表的分区信息是无效的。禁止表的生命周期功能后，表的生命周期配置及其分区的enable和disable标记会被保留。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理

总条数： 896

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

创建指定地址连通性测试请求 - 数据湖探索 DLI

查询组内资源包（废弃） - 数据湖探索 DLI

创建CSS类型跨源认证 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

查看队列的使用者（废弃） - 数据湖探索 DLI

查询所有表（废弃） - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

查询所有全局变量 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

重启/扩容/缩容队列 - 数据湖探索 DLI

查询作业执行计划 - 数据湖探索 DLI

边缘Flink作业Action回调（废弃） - 数据湖探索 DLI

本文样例表数据准备 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

上传jar类型分组资源（废弃） - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线