搜索_华为云

Spark作业开发类 - 数据湖探索 DLI

Spark作业使用咨询 Spark如何将数据写入到DLI表中通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
SQL作业开发类 - 数据湖探索 DLI

SQL作业开发类 SQL作业使用咨询如何合并小文件 DLI如何访问OBS桶中的数据创建OBS表时怎样指定OBS路径关联OBS桶中嵌套的JSON格式数据如何创建表 count函数如何进行聚合怎样将一个区域中的DLI表数据同步到另一个区域中？ SQL作业如何指定表的部分字段进行表数据的插入

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
Hbase - 数据湖探索 DLI
Hbase - 数据湖探索 DLI

Hbase HBase连接器支持读取和写入HBase集群。本文档介绍如何使用HBase连接器基于HBase进行SQL查询。 HBase连接器在upsert模式下运行，可以使用 DDL 中定义的主键与外部系统交换更新操作消息。但是主键只能基于HBase的rowkey字段定义。如果没

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

处理分析服务，当前，Flink计算引擎推荐版本：Flink 1.15，Spark计算引擎推荐版本： Spark 3.3.1。本节操作介绍如何升级作业的引擎版本。 SQL作业： SQL作业不支持配置引擎版本，需要您重新新建队列执行SQL作业，新创建的队列会默认使用新版本的Spark引擎。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

如果遇到提示SMN主题不存在您可以按照以下步骤进行排查：确认SMN主题是否已经创建。如果未创建，请在SMN服务管理控制台创建一个新的主题。如何自定义SMN主题，请参见《消息通知服务用户指南》中“创建主题”章节。检查IAM权限。如果SMN主题已经存在，但仍然提示不存在，请进入统

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
DLI API类 - 数据湖探索 DLI
DLI API类 - 数据湖探索 DLI

DLI API类如何获取AK/SK？如何获取项目ID？提交SQL作业时，返回“unsupported media Type”信息创建SQL作业的API执行超过时间限制，运行超时报错 API接口返回的中文字符为乱码，如何解决？

帮助中心 > 数据湖探索 DLI > 常见问题
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ Flink Jar作业上传配置文件操作流程自定义(JAR)作业支持上传配置文件。将配置文件通过程序包管理上传到DLI；在Flink jar作业的其他依赖文件参数中，选择创建的DLI程序包；在代码中通过ClassName

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复什么是从checkpoint恢复？ Flink Checkpoint 是一种容错恢复机制。这种机制保证了实时程序运行时，遇到异常或者机器问题时能够进行自我恢复。从checkpoint恢复的原则通常当作业执行失败

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据应用场景在车联网领域，云计算与大数据为企业提供了强大的分析挖掘能力，可以帮助企业和车队管理者更加科学、便捷地进行车辆数据管理与分析。方案架构根据已有的某货运公司车辆定时上报的详单数据和货运订单数据，DLI可以完成对该货运公司车辆行驶特点分析、记录明细的查询。

帮助中心 > 数据湖探索 DLI > 最佳实践
Flink作业性能调优类 - 数据湖探索 DLI

Flink作业性能调优类 Flink作业推荐配置指导 Flink作业性能调优 Flink作业重启后，如何保证不丢失数据？ Flink作业运行异常，如何定位 Flink作业重启后，如何判断是否可以从checkpoint恢复 DLI Flink作业提交运行后（已选择保存作业日志到OBS

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与Doris建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。如果使用MRS Doris，请在增强

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Flink作业咨询类 - 数据湖探索 DLI

Flink作业咨询类如何给子用户授权查看Flink作业？ Flink作业怎样设置“异常自动重启”？ Flink作业如何保存作业日志？ Flink作业管理界面对用户进行授权时提示用户不存在怎么办？手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ DLI使

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表如果需要关联OBS桶中嵌套的JSON格式数据，可以使用异步模式创建表。以下是一个示例的建表语句，展示了如何使用 JSON 格式选项来指定 OBS 中的路径： create table tb1 using json options(path

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Flink Jar作业类 - 数据湖探索 DLI

Flink Jar作业类 Flink Jar作业是否支持上传配置文件，要如何操作？ Flink Jar 包冲突，导致作业提交失败 Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 Flink Jar作业运行报错，报错信息为Authentication failed

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况查看Spark作业原始资源配置登录DLI 控制台，单击左侧“作业管理”>“Spark作业”，在作业列表中找到需要查看的Spark作业，单击“作业ID”前的，即可查看对应Spark作业的原始资源配置参数。在创建Spark作业时，

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

通用队列 Spark2.4 通用队列 Spark3.3 通用队列 V1表 √ √ 部分支持 V2表 × √ √ 父主题： Spark 2.4.x与Spark 3.3.x版本差异对比

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

yml文件用于保存DBT与DLI的连接信息。在安装DBT的服务器的主目录下找到 .dbt 目录，创建或编辑 profiles.yml 文件。例如，在Windows系统中，路径可能是 C:\Users\用户名\.dbt\profiles.yml。配置文件内容应包含DBT与DLI的连接配置，例如：

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询所有队列 - 数据湖探索 DLI

queue_type 否 String 队列的类型,。 sql general all 如果不指定，默认为“sql”。 cu_count 否 Integer 与该队列绑定的计算单元数，即当前队列的CU数。 charging_mode 否 Integer 队列的收费模式。 0：系统默认default队列。按照扫描量计费。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）

总条数： 668

上一页
1
...
5
6
7
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark作业开发类 - 数据湖探索 DLI

SQL作业开发类 - 数据湖探索 DLI

Hbase - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

DLI API类 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

Flink作业性能调优类 - 数据湖探索 DLI

Doris结果表 - 数据湖探索 DLI

Flink作业咨询类 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

Flink Jar作业类 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线