搜索_华为云

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark Jar作业读取和查询OBS数据。配置Spark作业：配置Spark作业访问OBS中存储的数据。提交Spark作业：完成作业编写后，提交并执行作业。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化，参考队列相关完成队列创建等操作。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

urce表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不同的连接参数，并确保Flink作业能够正确地将数据路由到各个集群。例如本例中分别对es1和es2定义连接器类型以及相关的属性。在对应的Flink作业中添加如下SQL语句。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
跨源访问MRS HBase，连接超时，日志未打印错误怎么办？ - 数据湖探索 DLI

HBase，连接超时，日志未打印错误怎么办？用户在跨源连接中没有添加集群主机信息，导致KRB认证失败，故连接超时，日志也未打印错误。建议您重新配置主机信息后再重试访问MRS HBase。在“增强型跨源”页面，单击该连接“操作”列中的“修改主机信息”，在弹出的对话框中，填写主机信息。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本（访问Java官网）。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其2019.1往后的版本。安装Maven 开发环境的基本配置（下载并安装 Maven）。用于项目管理，贯穿软件开发生命周期。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI作业开发流程 - 数据湖探索 DLI

据库和表。创建必要的存储桶来存储作业运行过程中产生的临时数据：作业日志、作业结果等。请参考配置DLI作业桶。配置元数据的访问权限。请参考在DLI控制台配置数据库权限、在DLI控制台配置表权限。 DLI数据导入指引 DLI支持在不迁移数据的情况下，直接对OBS中存储的数据进行查

 帮助中心 > 数据湖探索 DLI > 用户指南
弹性资源池扩缩容历史记录 - 数据湖探索 DLI

操作完成时间。 status String 扩缩容成功或者失败的状态。 fail_reason String 失败原因。请求示例 GET https://{endpoint}/v3/{project_id}/elastic-resource-pools/{elastic_resour

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

是否异步上传资源包。请求示例从OBS上传python文件至DLI，并定义分组名称为gatk。 { "paths": [ "https://test.obs.xxx.com/dli_tf.py" ], "group": " gatk" } 响应示例 {

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
创建批处理作业 - 数据湖探索 DLI

Object batch配置项，参考Spark Configuration。 name 否 String 创建时用户指定的批处理名称，不能超过128个字符。 driverMemory 否 String Spark应用的Driver内存，参数配置例如2G, 2048M。该配置项会替换“sc_

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

static_estimator_config 否 String 每个算子的流量/命中率配置，json格式的字符串。当static_estimator为true时需要配置该参数，配置时传入算子ID和算子流量配置。可先行调用该接口获取算子ID，即响应消息中stream_graph包含的o

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

String 连接数据库所需要的驱动。若未配置，则会自动通过URL提取。 username 否无 String 数据库认证用户名，需要和'password'一起配置。 password 否无 String 数据库认证密码，需要和'username'一起配置。 scan.partition

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
管理DLI全局变量 - 数据湖探索 DLI

长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。创建全局变量在DLI控制台左侧导航栏中单击“全局配置 > 全局变量”。在“全局变量”页面，单击右上角“创建变量”，可创建新的全局变量。表1 全局变量参数说明参数名称描述变量名称所创建的全局变量名称。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
队列属性设置 - 数据湖探索 DLI

driver，以提升队列资源的调度效率。本节操作介绍在管理控制台设置队列属性的操作步骤。约束与限制仅Spark引擎的SQL队列支持配置队列属性。仅在队列创建完成后支持设置队列属性。当前仅支持设置Spark driver相关队列属性。不支持批量设置队列属性。弹性资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
迁移数据场景概述 - 数据湖探索 DLI

具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。图1 迁移数据至DLI 常见迁移场景与迁移方案指导表1 常见迁移场景与迁移方案指导数据类型迁移工具迁移方案

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误当Spark作业运行大批量数据时，如果出现作业运行超时异常错误，通常是由于作业的资源配置不足、数据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

CTS可记录的DLI操作列表详见云审计服务支持的DLI操作列表说明。用户开通云审计服务并创建和配置追踪器后，CTS开始记录操作事件用于审计。关于如何开通云审计服务以及如何查看追踪事件，请参考《云审计服务快速入门》中的相关章节。 CTS支持配置关键操作通知。用户可将与IAM相关的高危敏感操作，作为关键操作加入

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
故障恢复 - 数据湖探索 DLI
故障恢复 - 数据湖探索 DLI

DLI系统采用存算分离的架构，计算集群基于K8s资源调度和故障切换机制，在系统故障时，支持自动故障恢复。作业级故障恢复 Flink、Spark作业支持配置自动重启恢复机制，在开启自动重启功能后，当作业出现异常时将自动重启恢复作业。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Confluent Avro Format - 数据湖探索 DLI

properties 否无 Map 转发到底层Schema Registry的属性Map。这对于没有通过Flink显示配置的配置项非常有用。但是，请注意，Flink配置项具有更高的优先级。 avro-confluent.ssl.keystore.location 否无 String

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Upsert Kafka结果表 - 数据湖探索 DLI

参数说明表1 参数说明参数是否必选说明 connector.type 是 connector类型，对于upsert kafka，需配置为'upsert-kafka' connector.version 否 Kafka版本，仅支持：'0.11' format.type 是数据序列化格式，支持：'csv'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 513

上一页
1
...
17
18
19
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

跨源访问MRS HBase，连接超时，日志未打印错误怎么办？ - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

弹性资源池扩缩容历史记录 - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

队列属性设置 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

故障恢复 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线