搜索_华为云

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据操作场景 DLI完全兼容开源的Apache Spark，支持用户开发应用程序代码来进行作业数据的导入、查询以及分析处理。本示例从编写Spark程序代码读取和查询OBS数据、编译打包到提交Spark Jar作业等完整的操作步骤说明来帮助您在DLI上进行作业开发。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。DLI可以从HBase中读取数据，用于过滤分析、数据转储等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
查询增强型跨源连接 - 数据湖探索 DLI

查询增强型跨源连接功能介绍该API用于查询该用户指定的已创建的增强型跨源连接。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v2.0/{project_id}/datasource/enhanced-connections/{connection_id}

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
FileSystem结果表 - 数据湖探索 DLI

FileSystem结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
查询弹性资源池下所有队列 - 数据湖探索 DLI

查询弹性资源池下所有队列功能介绍查询队列与弹性资源池的关联关系。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v3/{project_id}/elastic-resource-pools/{elastic_resource_pool_name}/queues

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
对象存储OBS结果表 - 数据湖探索 DLI

对象存储OBS结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
执行查询语句报错：The current account does not have permission to perform this operation,the current account was restricted. - 数据湖探索 DLI

执行查询语句报错：The current account does not have permission to perform this operation,the current account was restricted. Restricted for no budget

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
查询分组资源列表（废弃） - 数据湖探索 DLI

查询分组资源列表（废弃）功能介绍该API用于查询某个project下的所有资源，其中包含Group。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v2.0/{project_id}/resources 参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
创建消息通知主题 - 数据湖探索 DLI

阅，选择不同方式（例如短信或者邮件等）进行订阅。订阅成功后，如果作业失败，则系统将会自动发送消息到您指定的订阅终端。如果作业提交1分钟内立即失败，通常不会触发消息通知。如果作业提交1分钟后失败，则系统将会自动发送消息到您指定的订阅终端。操作步骤在“资源管理 > 队列管理”页面，单击左上角“创建消息通知主题”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

22 个查询(Q1~Q22)，其主要评价指标是各个查询的响应时间，即从提交查询到结果返回所需时间。TPC-H 基准测试的度量单位是每小时执行的查询数( QphH@size)，其中“H”表示每小时系统执行复杂查询的平均次数，“size”表示数据库规模的大小，能够反映出系统在处理查询时的能力。TPC-H

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

提交失败，只会在submit-client下生成提交日志。运行失败且在1分钟内的日志，可以直接在管理控制台页面查看，具体如下：在“作业管理”>“Flink作业”页面，单击对应的作业名称，进入作业详情页面，单击“运行日志”可以查看实时日志。运行失败且超过1分钟(日志转储周期1分钟)，会在application_xx下生成运行日志。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
如何获取项目ID？ - 数据湖探索 DLI

如何获取项目ID？项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。例如pro

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
如何申请扩大配额 - 数据湖探索 DLI

如何申请扩大配额如何申请扩大配额？登录管理控制台。在页面右上角，选择“资源 > 我的配额”。系统进入“服务配额”页面。图1 我的配额单击“申请扩大配额”。在“新建工单”页面，根据您的需求，填写相关参数。其中，“问题描述”项请填写需要调整的内容和申请原因。填写完毕后，勾选协议并单击“提交”。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI资源配额类
查询批处理作业详情 - 数据湖探索 DLI

查询批处理作业详情功能介绍该API用于根据批处理作业的id查询作业详情。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v2.0/{project_id}/batches/{batch_id} 参数说明表1 URI参数说明参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
查询作业监控信息（废弃） - 数据湖探索 DLI

查询作业监控信息（废弃）功能介绍该API用于查询作业监控信息, 支持同时查询多个作业的监控信息。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1.0/{project_id}/streaming/jobs/metrics

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > Flink作业相关API（废弃）
表继承数据库权限后，对表重复赋予已继承的权限会报错吗？ - 数据湖探索 DLI

因为继承的权限已经足够使用，重复授权还可能导致表权限管理上的混乱。在控制台操作表权限时：如果“用户授权”赋予表的权限与继承权限相同，系统会提示已有该权限无需重复操作。通过“项目授权”赋予的权限与继承权限相同时，系统不再向您提醒重复的权限信息。父主题： DLI权限管理类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
提交SQL作业（推荐） - 数据湖探索 DLI

该参数设置为true：当子查询中数据不重复的情况下，执行关联子查询，不需要对子查询的结果去重。当子查询中数据重复的情况下，执行关联子查询，会提示异常，必须对子查询的结果做去重处理，比如max(),min()。该参数设置为false：不管子查询中数据重复与否，执行关联子查询时，都需要对子查询的结果去重，比如max()

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

状态为“启动中”的作业不能查看SparkUI界面。目前DLI配置SparkUI只展示最新的100条作业信息。终止作业：终止启动中和运行中的作业。重新执行：重新运行该作业。归档日志：将作业日志保存到系统创建的DLI临时数据桶中。提交日志：查看提交作业的日志。 Driver日志：查看运行作业的日志。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
查询增强型跨源连接列表 - 数据湖探索 DLI

查询增强型跨源连接列表功能介绍该API用于查询该用户已创建的增强型跨源连接列表。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v2.0/{project_id}/datasource/enhanced-connections 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API

总条数： 1081

上一页
1
...
5
6
7
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

查询增强型跨源连接 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

查询弹性资源池下所有队列 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

执行查询语句报错：The current account does not have permission to perform this operation,the current account was restricted. - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

创建消息通知主题 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

如何申请扩大配额 - 数据湖探索 DLI

查询批处理作业详情 - 数据湖探索 DLI

查询作业监控信息（废弃） - 数据湖探索 DLI

表继承数据库权限后，对表重复赋予已继承的权限会报错吗？ - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

查询增强型跨源连接列表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线