搜索_华为云

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 S

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
DWS Connector概述 - 数据湖探索 DLI

数据的读写操作。您可以通过自定义函数（UDF）的方式使用DWS自研的DWS Connector。自定义函数操作请参考自定义函数。 DWS-Connector的使用方法请参考dws-connector-flink。（废弃，不推荐使用）DLI服务的DWS Connector：支持

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

源表：源表是Flink作业的数据输入表，例如Kafka等实时流数据输入。维表：数据源表的辅助表，用于丰富和扩展源表的数据。在Flink作业中，因为数据采集端采集到的数据往往比较有限，在做数据分析之前，就要先将所需的维度信息补全，而维表就是代表存储数据维度信息的数据源。常见的用户维表有 MySQL，Redis等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DIS结果表 - 数据湖探索 DLI
DIS结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据写入数据接入服务（DIS）中。适用于将数据过滤后导入DIS通道，进行后续处理的场景。数据接入服务（Data Ingestion Service，简称DIS）为处理或分析流数据的自定义应用程序构建数据流管道，主要解决云服务外的数据实时传输到云服务内的问题。数据

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

Hbase结果表功能描述 DLI将作业的输出数据输出到HBase中。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

业日志的OBS桶，方便后续查看作业日志。创建的HBase结果表的列簇必须定义为ROW类型，字段名对应列簇名（column family），嵌套的字段名对应列限定符名（column qualifier）。用户只需在表结构中声明查询中使用的的列簇和列限定符。除了ROW类型的列，剩下的原子数据类型字段（比如，STRING

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
跨源认证概述 - 数据湖探索 DLI

Kerberos类型的跨源认证：适用于开启Kerberos认证的MRS安全集群。 Kafka_SSL类型的跨源认证：适用于开启SSL的Kafka。 Password类型的跨源认证：适用于DWS、RDS、DDS、DCS数据源。跨源认证类型 DLI支持四种类型的跨源认证，不同的数据源按需选择相应的认证类型。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
从Kafka读取数据写入到RDS - 数据湖探索 DLI

步骤4：创建增强型跨源连接创建DLI连接Kafka的增强型跨源连接在Kafka管理控制台，选择“Kafka专享版”，单击对应的Kafka名称，进入到Kafka的基本信息页面。在“连接信息”中获取该Kafka的“内网连接地址”，在“基本信息”的“网络”中获取该实例的“虚拟私有云”和“子网”信息，方便后续操作步骤使用。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持久化的Catalog，二是利用Flink来读写Hive的表。Overview

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

包冲突，导致作业提交失败问题描述用户Flink程序的依赖包与DLI Flink平台的内置依赖包冲突，导致提交失败。解决方案首先您需要排除是否有冲突的Jar包。含DLI Flink提供了一系列预装在DLI服务中的依赖包，用于支持各种数据处理和分析任务。如果您上传的Jar包中包含DLI Flin

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

使用ogg-json读取kafka中的ogg记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

SQL使用DEW管理访问凭据创建的HBase结果表的列簇必须定义为ROW类型，字段名对应列簇名（column family），嵌套的字段名对应列限定符名（column qualifier）。用户只需在表结构中声明查询中使用的的列簇和列限定符。除了ROW类型的列，剩下的原子数据类型字段（比如，STRING

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
资产识别与管理 - 数据湖探索 DLI

可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置统一的标签将很容易帮助您对不同的应用进行使用量分析和成本核算。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
FileSystem结果表 - 数据湖探索 DLI

桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row Formats默认的策略是根据Part文件大小进行滚动，需要指定文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建增强型跨源连接 - 数据湖探索 DLI

数据源所使用的虚拟私有云。子网数据源所使用的子网。路由表显示子网实际绑定的路由表。说明：此处的路由表为目的数据源子网关联的路由表，不同于“路由信息”中的路由。“路由信息”中的路由为所绑定的队列下子网关联的路由表中的路由。目的数据源子网与队列所在子网为不同的子网，否则会造成网段冲突。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
导出SQL作业结果 - 数据湖探索 DLI

那么导出的作业结果的路径为obs://bucket/src1/test.csv 导出方式是随导出创建指定路径：该方式导出作业结果时，会创建一个新的文件夹路径，并将作业结果保存在这个路径中。适用于当您希望在新的路径下保存本次的导出结果的场景，方便作业结果的管理的回溯。选择

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。发布区域：以用户指南中的说明为准 DLI对接LakeFormation

帮助中心 > 数据湖探索 DLI > 功能总览
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

速入门》中的相关章节。 CTS支持配置关键操作通知。用户可将与IAM相关的高危敏感操作，作为关键操作加入到CTS的实时监控列表中进行监控跟踪。当用户使用DLI服务时，如果触发了监控列表中的关键操作，那么CTS会在记录操作日志的同时，向相关订阅者实时发送通知。 DLI的作业日志在

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全

总条数： 1277

上一页
1
2
3
4
5
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

DIS结果表 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线