搜索_华为云

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi数据表Clean规范 Clean也是Hudi表的维护操作之一，该操作对于MOR表和COW表都需要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？场景概述用户使用Flink SQL作业时，需要创建OBS分区表，用于后续进行批处理。操作步骤该示例将car_info数据，以day字段为分区字段，parquet为编码格式，转储数据到OBS。更多内容请参考《数据湖探索Flink SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

获取共享VPC下数据源的私有内网IP和端口。以RDS数据源为例：在RDS控制台“实例管理”页面，单击对应实例名称，查看“连接信息”>“内网地址”，即可获取RDS内网地址。查看“连接信息”>“数据库端口”，获取RDS数据库实例端口。在DLI管理控制台，单击“资源管理 > 队列管理”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 CTS可记录的DLI操作列表详见云审计服务支持的DLI操作列表说明。用户开通云审计服务并创建和配置追踪器后，CTS开始记录操作事件用于审计。关于如何开通云审计服务以及如何查看追踪事件，请参考《云审计服务快速入门》中的相关章节。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
费用账单 - 数据湖探索 DLI
费用账单 - 数据湖探索 DLI

间。查看指定队列或弹性资源池的账单 DLI控制台并未展示弹性资源池的ID。查询DLI队列或弹性资源池的资源账单，包含以下三步操作：在DLI云服务控制台获取资源名称。根据DLI资源名称，在“我的资源”页面根据资源名称查看资源ID。（资源名称不唯一，因此建议使用名称查询指定的资源ID后再查看账单。）

帮助中心 > 数据湖探索 DLI > 计费说明
Flink作业性能调优 - 数据湖探索 DLI

如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择“云服务监控 > 分布式消息服务 > kafka专享版” ，单击“kafka实例名称 > 消费组” ，选择具体的消费组名称，查看消费组的指标信息。图1 消费组反压状态反压状态是通过周期性对t

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
导出DLI表数据至OBS中 - 数据湖探索 DLI

单击“确定”即可导出数据。（可选）您可以在“作业管理”>“SQL作业”页面查看导出作业的“状态”、“执行语句”等信息。在“作业类型”中选择“EXPORT”，输入导出数据的时间段，即可查询出对应条件下的作业列表。单击导出作业名称前的，可查看导出作业的详细信息。父主题：在DLI控制台管理表资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
弹性资源池规格变更 - 数据湖探索 DLI

”，变更数量选择要扩容的CU数量。图1 规格变更扩容确定费用后，单击“提交”。扩容任务提交后，可以选择“作业管理 > SQL作业”，查看“SCALE_POOL”类型SQL作业的状态。如果作业状态为“规格变更中”，表示弹性资源池规格正在扩容中。等待作业状态变为“已成功”表示当前变更操作完成。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
配置多版本过期数据回收站 - 数据湖探索 DLI

配置多版本过期数据回收站功能描述在DLI数据多版本功能开启后，过期的备份数据后续在执行insert overwrite或者truncate语句时会被系统直接清理。OBS并行文件系统可以通过配置回收站加速删除操作过期的备份数据。通过在表属性添加配置“dli.multi.version

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
作业语义检验时提示DIS通道不存在怎么处理？ - 数据湖探索 DLI

作业语义检验时提示DIS通道不存在怎么处理？处理方法如下：登录到DIS管理控制台，在左侧菜单栏选择“通道管理”。检查Flink作业SQL语句中的DIS通道是否存在。如果Flink作业中的DIS通道还未创建，请参见《数据接入服务用户指南》中“开通DIS通道”章节。确保创建的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DLI SDK与API的对应关系 - 数据湖探索 DLI

{batch_id} 查询所有批处理作业 listAllBatchJobs - GET /v2.0/{project_id}/batches 查询批处理作业详情 - - GET /v2.0/{project_id}/batches/{batch_id} 查询批处理作业状态 getStateBatchJob

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
与其他云服务的关系 - 数据湖探索 DLI

备份数据：使用DLI提供导出API，将DLI的数据导出到OBS中备份。具体API请参考《导出数据》。存储查询结果：DLI提供API供用户将日常作业的查询结果数据保存到OBS。具体API请参考《导出查询结果》。与统一身份认证服务（IAM）的关系统一身份认证服务（Identity and Access

帮助中心 > 数据湖探索 DLI > 产品介绍
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述欢迎使用数据湖探索。数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、trino生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Flink作业相关API - 数据湖探索 DLI

Flink作业相关API 新建SQL作业更新SQL作业新建Flink Jar作业更新Flink Jar作业批量运行作业查询作业列表查询作业详情查询作业执行计划批量停止作业删除作业批量删除作业导出Flink作业导入Flink作业生成Flink SQL作业的静态流图

 帮助中心 > 数据湖探索 DLI > API参考
Flink作业常用操作 - 数据湖探索 DLI

单击“启动”后，跳转至“作业配置清单”页面。在“作业配置清单”页面，确认作业信息及价格，如果无误，单击“立即启动”。作业启动后，可在对应作业的“状态”列中查看运行成功或失败。停止作业当用户不需要运行某个作业时，用户可以将状态为“运行中”和“提交中”的作业停止。在DLI管理控制台的左侧导航栏

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

该报错信息可能是由于OBS桶被设置为了DLI日志桶，而日志桶不能用于DLI的其他业务功能。您可以按以下操作步骤进行查询：检查该OBS桶是否被设置为了DLI日志桶。在DLI管理控制台的“全局配置 > 作业配置” 页查看对应OBS桶是否被设置为了DLI日志桶，日志桶不能用于DLI的其他业务功能中。确认桶是否应用于其他业务功能。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
怎样将老版本的Spark队列切换成通用型队列 - 数据湖探索 DLI

怎样将老版本的Spark队列切换成通用型队列当前DLI服务包括“SQL队列”和“通用队列”两种队列类型。其中，“SQL队列”用于运行SQL作业，“通用队列”兼容老版本的Spark队列，用于运行Spark作业和Flink作业。通过以下步骤，可以将老版本的“Spark队列”转换为新的“通用队列”。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类

总条数： 1301

上一页
1
...
53
54
55
...
66
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

费用账单 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

弹性资源池规格变更 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

作业语义检验时提示DIS通道不存在怎么处理？ - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

Flink作业相关API - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

怎样将老版本的Spark队列切换成通用型队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线