搜索_华为云

Hudi表使用约束 - 数据湖探索 DLI

Hudi支持使用Spark SQL操作Hudi的DDL/DML的语法。但在使用DLI提供的元数据提交SparkSQL作业时，部分直接操作OBS路径的SQL语法暂不支持，详细说明请参考DLI Hudi SQL语法参考。不支持在HetuEngine中写Hudi表，以及修改Hudi表结构，仅支持读Hudi表。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

所在的位置，并指定了数据的结构，例如列名称、数据类型和表名称。数据库是表的逻辑分组。 OBS表、DLI表、CloudTable表不同表类型表示不同的数据存储位置。 OBS表表示数据存储在OBS服务的桶中。 DLI表表示数据存储在本服务内部的表中。 CloudTable表表示数据储存在CloudTable服务的表中。

帮助中心 > 数据湖探索 DLI > 产品介绍
Flink作业推荐配置指导 - 数据湖探索 DLI

计算配置，建议作业最大并行数为计算单元2倍为宜。勾选“保存作业日志”，选择一个OBS桶。如果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志勾选“作业异常告警”，选择1中创

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Postgres CDC源表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 PostgreSQL的版本不能低于PostgreSQL 11。若Postgres表有update等操作，需要

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

( 'connector' = 'filesystem', 'format' = 'parquet', 'path' = 'obs://xx' ); insert into sink select * from kafkaSource; 向kafka的作为source的topic中插入下列数据：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

计算配置，建议作业最大并行数为计算单元2倍为宜。勾选“保存作业日志”，选择一个OBS桶。如果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志勾选“作业异常告警”，选择1中创

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查看Flink作业详情 - 数据湖探索 DLI

作业配置的每个TaskManager所占CU数量。单TM Slot数作业配置的每个TaskManager Slot数量。 OBS桶作业配置了OBS桶显示。当勾选“开启Checkpoint”和“保存作业日志”参数后，用于保存Checkpoint和作业运行日志。保存作业日志开启或关闭。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建增强型跨源连接 - 数据湖探索 DLI

型跨源连接优先于增强型跨源连接。推荐使用增强型跨源连接。 DLI提供的default队列不支持创建跨源连接。 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。增强型跨源仅支持包年包月队列、按需计费模式下的专属队列。权限要求增强型跨源连接需要使

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

'properties.connector.kerberos.krb5' = 'obs://xx/krb5.conf', --krb5_conf路径 'properties.connector.kerberos.keytab' = 'obs://xx/user.keytab' --keytab路径

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

并且促使各个厂商以及研究机构将该项技术推向极限。本示例将演示DLI直接对存储在OBS中的TPC-H数据集进行查询的操作，DLI已经预先生成了100M的TPC-H-2.18的标准数据集，已将数据集上传到了OBS的tpch文件夹中，并且赋予了只读访问权限，方便用户进行查询操作。 TPC-H的测试和度量指标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

'hudi_table1', op => 'run', timestamp => 'xxx'); call run_compaction(path => 'obs://bucket/path/hudi_table1', op => 'run', timestamp => 'xxx'); 注意事项 compaction操作仅支持MOR表。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
创建并提交SQL作业 - 数据湖探索 DLI

提交SQL作业：提交SQL作业，创建数据库db1、表tb1、在表中插入数据，并查询数据接口相关信息 URI格式：POST /v1.0/{project_id}/jobs/submit-job {project_id}信息请从获取项目ID获取。请求参数说明详情，请参见提交SQL作业（推荐）。请求示例描

 帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 DBT（Data Build Tool），是一款开源的数据建模和转换工具，运行在Python环境上。DBT连接DLI，用来定义和执行SQL转换，支持从数据集成、转换到分析的整个数据生命周期管理，适用于大规模数据分析项目和复杂的数据分析场景。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

first; --修改分区表的存储位置（需要先在obs上创建目录，执行语句后，无法查到之前插入的那条数据） alter table altercolumn4 partition (c=500) set Location 'obs://bucket/user/hive/warehouse/c500';

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 Spark离线完成Compaction计划的执行，以及Clean和Archive操作，详见Hudi数据表Compaction规范。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Flink作业常用操作 - 数据湖探索 DLI

单击右上角“导出作业”，打开“导出作业”对话框。图2 导出作业选择保存作业的OBS桶。单击“下一步”。选择待导出的作业。默认导出所有作业，也可以勾选“自定义导出”选择需要导出的作业。单击“确认导出”，完成导出作业。导入作业用户可以将保存在OBS桶中的Flink作业配置文件导入至DLI的Flink作业管理中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

百分比与运行时计算的随机值之间的比较）。系统采样中行的选择依赖于使用的connector。例如，如果使用Hive数据源，这将取决于数据在OBS上的布局。这种采样方法不能保证独立的抽样概率。 SELECT * FROM users TABLESAMPLE SYSTEM (75); 父主题：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

using 参数hudi，定义和创建Hudi table。 table_comment 表的描述信息。 location_path OBS路径，指定该路径Hudi 表会创建为外表。 options_list Hudi table属性列表。表2 CREATE TABLE Options描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

add columns(new_col int comment 'add new column'); alter table delta.`obs://bucket_name0/db0/delta_table0` add columns(new_col string); 系统响应通

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Schema演进语法说明
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 1 2 3 4 5 6 7 8 9 create table printSink ( attr_name

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表

总条数： 761

上一页
1
...
31
32
33
...
39
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表使用约束 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

Print - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线