搜索_华为云

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

业即可。后续指引如果您想通过Spark Jar作业访问其他数据源，请参考《使用Spark作业跨源访问数据源》。如果您想通过Spark Jar作业在DLI创建数据库和表，请参考《使用Spark作业访问DLI元数据》。完整样例代码参考认证用的access.key和secret

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

计费。数据库数据库即按照数据结构来组织、存储和管理数据的仓库。DLI服务管理权限的基础单元是数据库，赋权以数据库为单位。在DLI中，表和数据库是定义底层数据的元数据容器。表中的元数据让DLI知道数据所在的位置，并指定了数据的结构，例如列名称、数据类型和表名称。数据库是表的逻辑分组。

帮助中心 > 数据湖探索 DLI > 产品介绍
导出DLI表数据至OBS中 - 数据湖探索 DLI

支持跨账号导出数据，即，如果B账户对A账户授权后，A账户拥有B账户OBS桶的元数据信息和权限信息的读取权限，以及路径的读写权限，则A账户可将数据导出至B账户的OBS路径中。导出数据步骤导出数据的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面导出数据。在管

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
查询Delta表历史版本数据 - 数据湖探索 DLI

查询Delta表历史版本数据命令格式查询Delta表历史某一时刻的状态： SELECT * FROM [database_name.]table_name TIMESTAMP AS OF timestamp_expression 查询Delta表某一历史版本的状态： SELECT

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

统将创建DLI临时数据桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志、作业结果等。如果不创建该桶，将无法查看作业日志。可以通过配置生命周期规则实现定时删除OBS桶中的对象或者定时转换对象的存储类别。桶名称为系统默认。如果不需要创建DLI临时数据桶，并且希望不再收到

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Hudi数据表管理操作规范 - 数据湖探索 DLI

Hudi数据表管理操作规范 Hudi数据表Compaction规范 Hudi数据表Clean规范 Hudi数据表Archive规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Hudi数据表设计规范 - 数据湖探索 DLI

Hudi数据表设计规范 Hudi表模型设计规范 Hudi表索引设计规范 Hudi表分区设计规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据问题现象客户创建Flink SQL作业，消费Kafka后sink到es集群，作业执行成功，但无数据。原因分析查看客户作业脚本内容，排查无问题，作业执行成功，出现该问题可能的原因如下：数据不准确。数据处理有问题。处理步骤在Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？问题现象手动在OBS表的分区目录下上传了分区数据，但是在SQL编辑器中查询该表新增的分区数据时却查询不到。解决方案手动添加分区数据后，需要刷新OBS表的元数据信息。具体操作如下： MSCK REPAIR TABLE

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Hudi Clustering操作说明 - 数据湖探索 DLI

将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能够支持快速摄取的同时不影响查询性能，引入了Clustering服务来重写数据以优化Hudi数据湖文件的布局。 Cluster

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

values(MAP(ARRAY['foo','bar'],ARRAY[1,2])); --查询数据 select * from map_tb; -- {bar=2, foo=1} ROW ROW的字段可是任意所支持的数据类型，也支持各字段数据类型不同的混合方式。 --创建ROW表 create table

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
创建Flink Jar作业 - 数据湖探索 DLI

Jar作业，访问其他外部数据源时，如访问OpenTSDB、HBase、Kafka、DWS、RDS、CSS、CloudTable、DCS Redis、DDS等，需要先创建跨源连接，打通作业运行队列到外部数据源之间的网络。当前Flink作业支持访问的外部数据源详情请参考DLI常用跨源分析开发方式。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
配置SQL防御规则 - 数据湖探索 DLI

配置SQL防御规则什么是SQL防御大数据领域的SQL引擎层出不穷，在带给解决方案多样性的同时，也暴露出一定的问题，例如SQL输入语句质量良莠不齐、SQL问题难定位、大SQL语句消耗资源过多等。低质量的SQL会对数据分析平台系统带来不可预料的冲击，影响系统的性能或者平台稳定性。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Format概述 - 数据湖探索 DLI
Format概述 - 数据湖探索 DLI

Flink 提供了一套与表连接器（table connector）一起使用的表格式（table format）。表格式是一种存储格式，定义了如何把二进制数据映射到表的列上。表1 Flink支持格式 Formats 支持的Connectors CSV Kafka, Upsert Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
设置多版本备份数据保留周期 - 数据湖探索 DLI

设置多版本备份数据保留周期功能描述在DLI数据多版本功能开启后，备份数据默认保留7天，您可以通过配置系统参数“dli.multi.version.retention.days”调整保留周期。保留周期外的多版本数据后续在执行insert overwrite或者truncate语

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Flink 1.15版本说明 - 数据湖探索 DLI

15版本说明 Flink 1.15版本在语法设计上实现了更高的兼容性，与主流开源技术标准保持一致。 Flink 1.15版本新增读写Hive、Hudi等Connector。 Flink 1.15版本数据同步迁移场景，优先推荐使用DataArts的数据集成。 Flink 1.15版本支持集成

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 DLI支持存储哪些格式的数据？ DLI支持如下数据格式： Parquet CSV ORC Json Avro DLI服务的数据可以存储在哪些地方？ OBS：SQL作业，Spark作业，Flink作业使用的数据均可以存储在OBS服务中，降低存储成本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
在DLI控制台删除数据库 - 数据湖探索 DLI

在DLI控制台删除数据库根据实际使用情况，您可以通过删除数据库。注意事项具有正在运行中的作业的数据库或者表不能删除。管理员用户、数据库的所有者和具有删除数据库权限的用户可以删除数据库。数据库和表删除后，将不可恢复，请谨慎操作。删除数据库在管理控制台左侧，单击“数据管理”>“库表管理”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

“运行中”。步骤6：发送数据和查询结果 Kafaka端发送数据。使用Kafka客户端向步骤2：创建Kafka的Topic中的Topic发送数据，模拟实时数据流。 Kafka生产和发送数据的方法请参考：DMS - 连接实例生产消费信息。发送样例数据如下： {"order_id

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
创建Kerberos跨源认证 - 数据湖探索 DLI

uth_name关联跨源认证。 Kerberos类型跨源认证支持连接的数据源 Kerberos类型跨源认证支持连接的数据源如表1所示。表1 Kerberos类型跨源认证支持连接的数据源作业类型表类型数据源约束与限制 Flink OpenSource SQL 源表 HBase

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证

总条数： 1508

上一页
1
...
10
11
12
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

查询Delta表历史版本数据 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

Hudi数据表管理操作规范 - 数据湖探索 DLI

Hudi数据表设计规范 - 数据湖探索 DLI

Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

Format概述 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

Flink 1.15版本说明 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

在DLI控制台删除数据库 - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线