搜索_华为云

Hudi表模型设计规范 - 数据湖探索 DLI

通过Spark Datasource API或者Flin写Hudi表的场景，通过这两种方式写Hudi时需要增加向Hive同步元数据的配置项；该配置的目的是将Hudi表的元数据统一托管到Hive元数据服务中，为后续的跨引擎操作数据以及数据管理提供便利。父主题： Hudi数据表设计规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
创建表时指定表的生命周期 - 数据湖探索 DLI

external.table.purge 否仅OBS表支持配置该参数。是否需要在删除表或分区时，清除path路径下的数据。默认不删除。设置'external.table.purge'='true'时：非分区OBS表配置删除文件后，表目录也会删除。分区OBS表自定义分区数据也会删除。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

compaction命令时，禁止将hoodie.run.compact.only.inline设置成false，该值需要设置成true。错误示例：配置参数 hoodie.run.compact.only.inline=false 随后执行SQL run compaction on dsrTable;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
SHOW_INVALID_PARQUET - 数据湖探索 DLI

database table 无 SELECT 细粒度权限：dli:table:select 由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应可以检查任务状态是否成功，查看任务结果，查看任务日志确认有无异常。父主题： Hudi CALL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

DLI跨源表执行insert操作时，会将DWS源表删除重建，客户没有对应更新DLI端跨源表建表语句，导致更新的DWS源表被替换。处理步骤新建DLI跨源表，并添加建表配置项 truncate = true（只清空表数据，不删除表）。建议与总结在更新跨源目的端源表后，必须同时更新对应DLI跨源表。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

); 参数说明通用配置项参数默认值是否必选参数类型说明 fenodes -- 是 Doris FE ip地址和port, 多实例之间使用逗号分隔。其中port可登录FusionInsight Manager，选择“集群 > 服务 > Doris > 配置”，在搜索框中搜索

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
查看指定表所有分区 - 数据湖探索 DLI

语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。参数说明表1 参数描述参数描述 db_name Da

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
提交SQL作业（废弃） - 数据湖探索 DLI

SQL语句执行所在的数据库。当创建新数据库时，不需要提供此参数。 conf 否 Array of objects 用户定义适用于此作业的配置参数。目前支持的配置项： dli.sql.join.preferSortMergeJoin（是否优先使用SortMergeJoin） dli.sql

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

份认证服务（IAM），选择对应子账户所在的用户组，确保该用户组已添加相应Region的SMN策略。确认主题名称和区域。确保您在DLI中配置的SMN主题名称和区域与实际创建的SMN主题一致。如果SMN主题名称不一致也会导致系统提示SMN主题不存在。父主题： Flink作业咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

数据的具体格式通过调用ImportJob对象的setCsvFormatInfo接口进行设置。在提交导入作业前，可选择设置导入数据的分区并配置是否是overwrite写入，分区信息可以调用ImportJob对象的setPartitionSpec接口设置，如：importJob.setPartitionSpec(new

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
Hudi表索引设计规范 - 数据湖探索 DLI

文件的footer中。 Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写入；该索引写入速度最快，但是需要合理配置分桶数目；Flink、Spark均支持该索引写入。状态索引：Flink引擎独有索引，是将行记录的存储位置记录到状态后端的一种索引形式，在

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

username 否数据库认证用户名，需要和'connector.password'一起配置 connector.password 否数据库认证密码，需要和'connector.username'一起配置 connector.read.partition.column 否用于对输入进行分区的列名

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

登录DLI管理控制台，单击“作业管理 > SQL作业”，对应SQL作业行的操作列，单击“编辑”按钮，跳转到“SQL编辑器”。在“SQL编辑器”中，单击“设置”，参考如下图配置添加参数。图1 设置参数重新执行作业。父主题： SQL作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
查看队列的基本信息 - 数据湖探索 DLI

要的队列资源。单击查看队列的详细信息。关于队列引擎相关字段的含义：执行引擎：负责执行队列中任务的引擎类型。默认版本：执行引擎的默认配置版本，或者是在没有指定特定版本时系统将使用的版本。支持版本：执行引擎支持的所有版本列表。通过查看队列的支持版本，您可以了解哪些版本的执行引擎可以用于处理队列中的任务。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
DELETE - 数据湖探索 DLI
DELETE - 数据湖探索 DLI

DELETE所需权限列表权限描述表的DELETE权限细粒度权限：dli:table:delete。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例 delete from delta_table0 where column1 = 'value1';

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
认证鉴权 - 数据湖探索 DLI
认证鉴权 - 数据湖探索 DLI

认证鉴权调用API有如下两种认证方式，您可以任选其中一种进行认证鉴权。 Token认证：通过Token认证调用请求。 AK/SK认证：通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证，其安全性比Token认证更高。

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
创建弹性资源池 - 数据湖探索 DLI

队列的标签，使用标签标识云资源。包括“标签键”和“标签值”，具体请参考表3。 label 否 map 弹性资源池属性字段。如果需要购买基础版，配置该参数值为{"spec":"basic"}。不配置该参数时默认为标准版弹性资源池。表3 tags参数参数名称是否必选参数类型说明 key 是 String

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

enabled 否 true Boolean Flink默认采用的是内存索引（使用Bueckt索引时不配置该项），需要将数据的主键缓存到内存中，保证目标表的数据唯一，因此需要配置该值，否则会导致数据重复，默认值：true。 write.index_bootstrap.tasks 否

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
ALTER COLUMN - 数据湖探索 DLI
ALTER COLUMN - 数据湖探索 DLI

TABLE所需权限列表权限描述表的ALTER权限细粒度权限：dli:table:alter。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例其他修改 ALTER TABLE table1 ALTER COLUMN col_a DROP

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Schema演进语法说明

总条数： 568

上一页
1
...
23
24
25
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表模型设计规范 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

SHOW_INVALID_PARQUET - 数据湖探索 DLI

更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

Doris源表 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

查看队列的基本信息 - 数据湖探索 DLI

DELETE - 数据湖探索 DLI

认证鉴权 - 数据湖探索 DLI

创建弹性资源池 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

ALTER COLUMN - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线