搜索_华为云

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
跨源认证权限管理 - 数据湖探索 DLI

赋权：当前用户可将跨源认证的权限赋予其他用户。回收：当前用户可回收其他用户具备的该跨源认证的权限，但不能回收该跨源认证所有者的权限。查看其他用户具备的权限：当前用户可查看其他用户具备的该跨源认证的权限。修改当前用户的权限登录DLI管理控制台。单击“跨源管理 > 跨源认证”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

DLI提供了一个通用接口，可用于获取用户在启动Spark作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。获取到的委托的临时认证封装到com.huaweicloud.sdk.core

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
创建SQL作业模板 - 数据湖探索 DLI

创建SQL作业模板为了便捷快速的执行SQL操作，DLI支持定制模板或将正在使用的SQL语句保存为模板。保存模板后，不需编写SQL语句，可通过模板直接执行SQL操作。 SQL模板包括样例模板和自定义模板。当前系统默认的样例模板包括22条标准的TPC-H查询语句，可以满足用户大部分的TPC-H需求场

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
创建并使用跨源链接 - 数据湖探索 DLI

创建并使用跨源链接场景描述本章节指导用户通过API创建增强型跨源连接。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。创建增强型跨源连接之前需要获取需要建立连接的服务对应VPC的ID和其所在子网的网络ID。获取VPC的ID接口，具体请参考《虚拟私有云

 帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
使用CTS审计DLI服务 - 数据湖探索 DLI

使用CTS审计DLI服务通过云审计服务，您可以记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。表1 云审计服务支持的DLI操作列表操作名称资源类型事件名称创建数据库 database createDatabase 删除数据库 database deleteDatabase

帮助中心 > 数据湖探索 DLI > 用户指南
创建Kerberos跨源认证 - 数据湖探索 DLI

String 创建源表、结果表、维表时均使用该字段关联跨源认证。 Kafka krb_auth_name 否 String 创建源表、结果表时均使用该字段关联跨源认证。创建的Kerberos类型的跨源认证名称。如果使用SASL_PLAINTEXT类型，且使用Kerberos认证，则需要同时配置以下参数：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业登录DLI管理控制台，选择“SQL编辑器”首进入提交SQL作业的界面。提交SQL作业时需要选择支持Hudi的Spark SQL队列。创建一张Hudi表：将如下的建表语句粘贴至DLI SQL编辑器的输入区域，修改 LOCATION

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
创建CSS类型跨源认证 - 数据湖探索 DLI

安全集群的登录密码。 Certificate路径上传“安全证书”的OBS路径。即步骤2的OBS桶地址。图1 创建认证信息-CSS 访问CSS的表。跨源认证创建成功后，在创建访问CSS的表时只需关联跨源认证即可安全访问数据源。例如在使用Spark SQL来创建访问CSS的表时使用es

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
创建并提交SQL作业 - 数据湖探索 DLI

QL作业。使用须知首次进入SQL编辑器，页面会提示设置DLI作业桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志等。如果不创建该桶，将无法查看作业日志。桶名称为系统默认。在OBS管理控制台页面通过配置桶的生命周期规则，可以实现定时删除OBS桶中的对象或者定时转换对象的存储类别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询SQL作业日志 - 数据湖探索 DLI

不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询Spark作业日志 - 数据湖探索 DLI

前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用DLI分析电商BI报表 - 数据湖探索 DLI

Browser+提供强大的拖拽上传功能，您可以将本地的一个或多个文件或者文件夹拖拽到对象存储的对象列表或者并行文件系统的对象列表中；同时您也可以将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_04.zip获取本示例的测试数据，解压“Best_Practice_04

帮助中心 > 数据湖探索 DLI > 最佳实践
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

是 DLI服务的队列名称。 dli_test database 是数据目录名称。默认使用dli数据目录。如果使用Lakeformation元数据，填写具体的数据目录名称。 dli schema 是提交作业使用的DLI的数据库名称。 tpch 步骤3：测试使用DBT提交作业至DLI

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
OBS授权 - 数据湖探索 DLI
OBS授权 - 数据湖探索 DLI

SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。样例代码用户可以使用OBS授权操作的接口，将OBS桶的操作权限授权给DLI, 用于保存用户作业的数据和作业的运行日志等。示例代码如下： 1 2 3 4 5 6 7 private static

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 1. 添加如下依赖 <dependency> <groupId>io.delta</groupId> <artifactId>delta-core_2.12</artifactId> <version>2.3

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
查询Flink作业日志 - 数据湖探索 DLI

不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建Flink Jar作业 - 数据湖探索 DLI

所属队列选择作业运行时使用的队列资源。应用程序选择Jar作业程序包。 Jar包的管理方式：上传OBS管理程序包：提前将对应的jar包上传至OBS桶中。并在此处选择对应的OBS路径。上传DLI管理程序包：提前将对应的jar包上传至OBS桶中，并在DLI管理控制台的“数据管理>程序

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
调用说明 - 数据湖探索 DLI
调用说明 - 数据湖探索 DLI

API中除特殊说明外，通常为同步操作，即响应消息中的“is_success”为请求是否执行成功。若API为异步操作，可根据响应消息中的“job_id”，执行查询作业状态API，从而获取该异步操作API最终是否执行成功。同时数据湖探索还提供多种编程语言的SDK供您使用，SDK的使用方法请参见华为云开发工具包（SDK）。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

json数据类型的数据，输出到日志文件中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据Kafka的地址测试队列连通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 1102

上一页
1
...
4
5
6
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

跨源认证权限管理 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

创建CSS类型跨源认证 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

OBS授权 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

调用说明 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线