搜索_华为云

Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi数据表Clean规范 Clean也是Hudi表的维护操作之一，该操作对于MOR表和COW表都需要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
创建表时指定表的生命周期 - 数据湖探索 DLI

同名。语法格式 DataSource语法创建DLI表 CREATE TABLE table_name(name string, id int) USING parquet TBLPROPERTIES( "dli.lifecycle.days"=1 ); Hive语法创建DLI表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范写作业未停止情况下，禁止手动执行run schedule命令生成compaction计划。错误示例： run schedule on dsrTable 如果还有别的任务在写这张表，执行该操作会导致数据丢失。执行run

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败问题描述使用Spark访问元数据时，DataSource语法创建avro类型的OBS表创建失败。图1 avro类型的OBS创建失败根因分析当前Spark2.3.x不支持创建avro类型的OBS表，Spark2

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表模型设计规范规则 Hudi表必须设置合理的主键。 Hudi表提供了数据更新和幂等写入能力，该能力要求Hudi表必须设置主键，主键设置不合理会导致数据重复。主键可以为单一主键也可以为复合主键，两种主键类型均要求主键不能有null值和空值，可以参考以下示例设置主键： SparkSQL：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

创建OBS表时，OBS路径须指定到数据库下的具体表层路径。路径格式为：obs://xxx/数据库名/表名。创建OBS表更多语法介绍请参考《数据湖探索Spark SQL语法参考》。正确示例 CREATE TABLE `di_seller_task_activity_30d`(`user_id`

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建并提交SQL作业 - 数据湖探索 DLI

您的业务逻辑。了解模板更多信息请参考创建SQL作业模板。单击“更多”中的“语法校验”，确认SQL语句书写是否正确。如果语法校验失败，请参考《数据湖探索SQL语法参考》检查SQL语句准确性。如果语法校验通过，单击“执行”，阅读并同意隐私协议，单击“确定”后执行SQL语句。 S

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Flink作业提交错误，如何定位 - 数据湖探索 DLI

在Flink作业管理页面，将鼠标悬停到提交失败的作业状态上，查看失败的简要信息。常见的失败原因可能包括： CU资源不足：需扩容队列。生成jar包失败：检查SQL语法及UDF等。如果信息不足以定位或者是调用栈错误，可以进一步单击作业名称，进入到作业详情页面，选择“提交日志”页签，查看作业提交日志。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
常用操作与系统权限关系 - 数据湖探索 DLI

常用操作与系统权限关系表1列出了DLI SQL常用操作与系统策略的授权关系，您可以参照该表选择合适的系统策略。更多SQL语法赋权请参考《权限列表》章节。表1 DLI常用操作与系统权限的关系资源操作说明 DLI FullAccess DLI ReadOnlyAccess Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

SQL DDL/DML/函数等语法说明及限制可参考Table API & SQL。 Flink OpenSource SQL1.15语法请参考Flink OpenSource SQL1.15语法。 Flink OpenSource SQL1.12语法请参考Flink OpenSource

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
用户通过CTAS创建hive表报schema解析异常错误 - 数据湖探索 DLI

用户通过CTAS创建hive表报schema解析异常错误目前DLI支持hive语法创建TEXTFILE、SEQUENCEFILE、RCFILE、ORC、AVRO、PARQUET文件类型的表。如果用户CTAS建表指定的文件格式为AVRO类型，而且直接使用数字作为查询语句（SELECT）的输入，如“CREATE

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

SL的Kafka。 Password类型的跨源认证：适用于DWS、RDS、DDS、DCS数据源。 SQL语法相关约束限制表9 SQL语法相关约束限制限制项说明 SQL语法限制不支持在创建DLI表时指定存储路径。 SQL语句大小限制须小于500000字符。须小于1MB。

帮助中心 > 数据湖探索 DLI > 产品介绍
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

该示例将car_info数据，以day字段为分区字段，parquet为编码格式，转储数据到OBS。更多内容请参考《数据湖探索Flink SQL语法参考》。 1 2 3 4 5 6 7 8 9 10 11 12 13 create sink stream car_infos

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

Jar连接开启SASL_SSL认证的Kafka的操作方法。如需使用Flink OpenSource SQL连接开启SASL_SSL认证的Kafka，请参考Flink SQL语法参考-Kafka源表。环境准备已在DLI控制台购买了通用队列。已购买了Kafka实例，并开启了SASL_SSL认证。已在DLI创建

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Spark作业使用咨询 - 数据湖探索 DLI

义调度。使用DataArts Studio服务进行作业开发请参考《数据治理中心用户指南》。 Spark SQL语法创建表时是否支持定义主键 Spark SQL语法不支持定义主键。 DLI Spark jar作业是否能访问DWS跨源表？可以访问。详细操作请参考访问DWS和访问SQL库表。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
SQL作业使用咨询 - 数据湖探索 DLI

temporary table ...” 语法来创建临时表，通过该表存储临时数据，结束事务或者会话后该表数据自动清除。当前DLI是否支持该功能？解决措施：当前DLI不支持创建临时表功能，只能根据当前业务逻辑控制来实现相同功能。DLI支持的SQL语法可以参考创建DLI表。可以本地连接DLI吗

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

产品优势纯SQL操作 DLI提供标准SQL接口，用户仅需使用SQL便可实现海量数据查询分析。SQL语法全兼容标准ANSI SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算

 帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 881

上一页
1
...
40
41
42
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

Flink作业提交错误，如何定位 - 数据湖探索 DLI

常用操作与系统权限关系 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

用户通过CTAS创建hive表报schema解析异常错误 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线