搜索_华为云

增强型跨源连接概述 - 数据湖探索 DLI

DLI跨源分析场景连接外部数据源时，由于数据源的VPC与DLI VPC不同，网络无法连通，导致DLI无法读取数据源数据。DLI提供的增强型跨源连接功能可以实现DLI与数据源的网络连通。本节操作为您介绍跨VPC的数据源网络连通方案：创建增强型跨源连接：采用对等连接的方式打通DLI与数据源的VPC网络。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件确保已创建Kafka集群。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
插入数据至DCS表 - 数据湖探索 DLI

插入数据至DCS表功能描述 INSERT INTO命令将DLI表中的数据插入到已关联的DCS Key中。语法格式将SELECT查询结果插入到表中： 1 2 3 4 5 6 7 INSERT INTO DLI_TABLE SELECT field1,field2...

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
在DLI控制台配置数据库权限 - 数据湖探索 DLI

如果数据库被删除后，再重新创建同名的数据库，数据库权限不会继承，需要对操作该数据库的用户或项目重新进行赋权。例如，testdb数据库给用户A赋予了删除数据库的权限，后续执行了删除testdb数据库，并重新创建了testdb数据库。如果希望A用户继续保留删除testdb数据库的权限，则需要重新对A用户赋予该权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
多版本备份恢复数据 - 数据湖探索 DLI

多版本备份恢复数据设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据父主题：表相关

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关
DELETE - 数据湖探索 DLI
DELETE - 数据湖探索 DLI

DELETE所需权限列表权限描述表的DELETE权限细粒度权限：dli:table:delete。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例 delete from delta_table0 where column1 =

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没有包含分区字段，则

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
提交SQL作业（推荐） - 数据湖探索 DLI

2”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。当前配置设置为“true”时，DLI不会提前删除分区，而是在运行时覆盖那些有数据写入的分区。 spark.sql.files.maxPartitionBytes 134217728 读取文件时要打包到单个分区中的最大字节数。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
查询HBase表 - 数据湖探索 DLI
查询HBase表 - 数据湖探索 DLI

通过hbase进行数据过滤，即HBase Client将过滤条件传给HBase服务端进行处理，HBase服务端只返回用户需要的数据，提高了Spark SQL查询的速度。对于HBase不支持的过滤条件，例如组合Rowkey的查询，直接由Spark SQL进行。支持查询下压的场景数据类型场景

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

CTS支持配置关键操作通知。用户可将与IAM相关的高危敏感操作，作为关键操作加入到CTS的实时监控列表中进行监控跟踪。当用户使用DLI服务时，如果触发了监控列表中的关键操作，那么CTS会在记录操作日志的同时，向相关订阅者实时发送通知。 DLI的作业日志在创建DLI作业时，可以在作业编辑页面，

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通操作场景公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Flink Jar作业类 - 数据湖探索 DLI

Jar作业是否支持上传配置文件，要如何操作？ Flink Jar 包冲突，导致作业提交失败 Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 Flink Jar作业运行报错，报错信息为Authentication failed Flink Jar作业设置backend为OBS，报错不支持OBS文件系统

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
Python SDK环境配置 - 数据湖探索 DLI

setup.py install 运行结果参见图2所示。图2 安装Python SDK Python开发环境配置 SDK获取与安装初始化DLI客户端父主题： Python SDK

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

行，即为数据倾斜的情况。图1 数据倾斜样例常见数据倾斜场景 Group By聚合倾斜在执行Group By聚合操作时，如果某些分组键对应的数据量特别大，而其他分组键对应的数据量很小，在聚合过程中，数据量大的分组会占用更多的计算资源和时间，导致处理速度变慢，出现数据倾斜。 JOIN

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

overwrite覆盖分区表数据的时候，覆盖了全量数据？当您使用insert overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
本文样例表数据准备 - 数据湖探索 DLI

本文样例表数据准备 --创建具有TINYINT类型数据的表。 CREATE TABLE int_type_t1 (IT_COL1 TINYINT) ; --插入TINYINT类型数据 insert into int_type_t1 values (TINYINT'10');

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > 附录
跨源认证概述 - 数据湖探索 DLI

您使用“数据加密服务DEW”或“DLI提供的跨源认证方式”来存储数据源的认证信息。数据加密服务（Data Encryption Workshop, DEW）是一个综合的云上数据加密服务，为您解决数据安全、密钥安全、密钥管理复杂等问题。推荐使用数据加密服务DEW来存储数据源的认证信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
创建增强型跨源连接 - 数据湖探索 DLI

使用DLI访问其他数据源的数据前，首先要通过建立增强型跨源连接打通DLI和数据源之间的网络，DLI才能够访问、导入、查询、分析其他数据源的数据。例如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和对应数据源VPC之间的网络，才能实现数据互通。本节操作介

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
partition - 数据湖探索 DLI
partition - 数据湖探索 DLI

partition_specs 格式 partition_specs : (partition_col_name = partition_col_value, partition_col_name = partition_col_value, ...); 说明表的分区列表，以k

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符

总条数： 1505

上一页
1
...
9
10
11
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

增强型跨源连接概述 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

插入数据至DCS表 - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

多版本备份恢复数据 - 数据湖探索 DLI

DELETE - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

查询HBase表 - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

Flink Jar作业类 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

本文样例表数据准备 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

partition - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线