搜索_华为云

CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

对表执行clean操作时需要表的owner才可以执行。如果需要修改clean默认的参数，需要在执行SQL时，在设置中配置需要保留的commit数量等参数，参见Hudi常见配置参数。使用由DLI提供的元数据服务时，本命令不支持使用OBS路径。系统响应可以检查任务状态是否成功，查看任务日志确认有无异常。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
DROP TABLE - 数据湖探索 DLI
DROP TABLE - 数据湖探索 DLI

由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例 DROP TABLE IF EXISTS db0.delta_table0; 系统响应执行成功，元数据中表将被删除，无法通过show和describe查询该表。父主题： Delta DDL语法说明

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
Hudi Clustering操作说明 - 数据湖探索 DLI

了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Hudi数据表Compaction规范 - 数据湖探索 DLI

tion作业CPU与内存的比例按照1:4~1:8配置，保证Compaction作业稳定运行。当Compaction出现OOM问题，可以通过调大内存占比解决。建议通过增加并发数提升Compaction性能。 CPU和内存比例配置合理会保证Compaction作业是稳定的，实现单个Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

cache.max-rows 否无 Integer 维表配置，缓存的最大行数，超过该值时，最先添加的数据将被标记为过期。默认表示不使用该配置。 lookup.cache.ttl 否无 Duration 维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length value}{time

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

thread-num 来配置线程号。默认值为 3，配置的值应大于 0。 Key Default Type Description table.exec.hive.load-partition-splits.thread-num 3 Integer 配置的值应大于0。 SQL 提示可用于将配置应用于

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

图2 Full GC 处理步骤如果频繁Full GC, 建议排查代码，是否有内存泄漏。增加单TM所占的资源。联系技术支持，修改集群心跳配置参数。父主题： Flink作业性能调优类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

path_num 指定目录的子目录数量 file_num 指定目录的文件数量 storage_size 该目录的Size（bytes） storage_size(unit) 该目录的Size（KB） storage_path 指定目录的完整FS绝对路径 space_consumed

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

运行Spark作业，作业运行失败，作业日志中提示No respond错误解决方案重新创建Spark作业，创建作业时需要在“Spark参数（--conf）”中添加配置：“spark.sql.mrs.opentsdb.ssl.enabled=true”。父主题：对接OpenTSDB

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
Hudi表索引设计规范 - 数据湖探索 DLI

的footer中。 Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写入；该索引写入速度最快，但是需要合理配置分桶数目；Flink、Spark均支持该索引写入。状态索引：Flink引擎独有索引，是将行记录的存储位置记录到状态后端的一种索引形式，在作业

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
FileSystem结果表 - 数据湖探索 DLI

完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Flink作业配置参数对于Flink Jar作业，您需要在代码中开启Checkpoint，同时如果有自定义的状态需要保存，您还需要实现ListCheckpointed接口，并为每个算子设置唯一ID。然后在作业配置中，勾选“从Checkpoint恢复”，并准确配置Checkpoint路径。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Connector。详细操作请参考Flink OpenSource SQL1.15语法概览。 Flink 1.15需要配置租户面自定义委托，并在作业中配置委托信息。委托的权限需要根据作业具体的业务场景需求进行配置。详情操作请参考DLI自定义委托。 Flink 1.15作业管理凭据的方法： Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

如果选择Spark版本为3.3.1时，支持在Spark参数（--conf)配置计算资源规格参数，且conf的配置优先级高于高级配置指定的值。参数对应关系请参考表5。在Spark参数（--conf)配置计算资源规格参数时，可以配置单位 M/G/K，不配置时候默认单位为byte。表5 控制台计算资源规

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
查询作业模板列表 - 数据湖探索 DLI

U核数。该配置项会替换sc_type中对应的默认参数。 numExecutors Integer Spark应用Executor的个数。该配置项会替换sc_type中对应的默认参数。 obs_bucket String 保存Spark作业的obs桶，需要保存作业时配置该参数。 auto_recovery

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
对象存储OBS结果表 - 数据湖探索 DLI

完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
查询作业列表 - 数据湖探索 DLI

大于ID或小于ID的限定条数的作业，默认查询全部状态的作业，也可以设定运行中或其他状态条件。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id}/streaming/jobs 参数说明表1 URI参数说明参数名称

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
创建弹性资源池并添加队列 - 数据湖探索 DLI

资源池管理页面。选择要操作的弹性资源池，在“操作”列，单击“添加队列”。在“添加队列”界面，首先需要配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名参数描述名称弹性资源池添加的队列名称。类型 SQL队列：用于运行SQL作业。通用队列：用于运行Spark作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_insert：该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
修改主机信息 - 数据湖探索 DLI

修改主机信息功能介绍该API用于在跨源中修改数据源主机信息，仅支持全量覆盖。调试您可以在API Explorer中调试该接口。 URI URI格式 PUT /v2.0/{project_id}/datasource/enhanced-connections/{connection_id}

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API

总条数： 804

上一页
1
...
9
10
11
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CLEAN - 数据湖探索 DLI

DROP TABLE - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

修改主机信息 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线