搜索_华为云

Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

mpaction形成很大压力需要更多资源才能完成。 Hudi表在Hive元数据中，应该会存在1张内部表（手动创建），2张外部表（写入数据后自动创建）。 2张外部表，表名_ro（用户只读合并后的parquet文件，即读优化视图表），_rt（读实时写入的最新版本数据，即实时视图表）。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应： HetuEngine通过自动优化资源与负载的配比，能够对TB级数据实现秒级响应，极大提升了数据查询的效率。 Serverless资源开箱即用： Serverless服

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

cdc-events-duplicate设置为true，并在源表上定义PRIMARY KEY。Framework将生成一个额外的有状态操作符，并使用主键对变更事件进行去重，并生成一个规范化的changelog流。参数说明表1 参数说明参数是否必选默认值类型说明 format 是 (none)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用default创建DataSource表时引擎版本不低于Spark 3.3.1，如果引擎版本低于Spark 3.3.1则会提示上述错误信息，此时请切换使用Hive语法创建表。详细操作请参考使用Hive语法创建OBS表。使用Spark 3.3.1执行jar作业报错 "xxx don`t support

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

e temporal join始终会加入最新版本的时态表。Flink支持分区表和 Hive非分区表的临时连接，对于分区表，Flink 支持自动跟踪Hive表的最新分区。详情可参考：Apache Flink Hive Read & Write 注意事项 Flink目前不支持与Hiv

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

parallel_number 否 Integer 最大并行度。并行数为作业每个算子的并行数，适度增加并行数会提高作业整体算力，但也须考虑线程增多带来的切换开销，上限是计算单元CU数的4倍，最佳实践为计算单元CU数的1-2倍。 tm_cus 否 Integer 单个taskManagerCU数量。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

id 对 source 可选，不适用于 sink 无 String Kafka source 的消费组 id。如果未指定消费组 ID，则会使用自动生成的 "KafkaSource-{tableIdentifier}" 作为消费组 ID。 properties.* 否无 String

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
离线Compaction配置 - 数据湖探索 DLI

// 打开异步清理 set hoodie.clean.automatic = false; // 关闭自动清理，防止compaction操作触发clean run compaction on $tablename;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
管理Flink作业模板 - 数据湖探索 DLI

创建作业使用当前模板创建作业。格式化对SQL语句进行格式化，将SQL语句格式化后，需要重新编辑SQL语句。主题设置更改字体大小、自动换行、页面风格（黑色底或白色底）等配置。在SQL语句编辑区域，输入SQL语句，实现业务逻辑功能。SQL语句的编写请参考《数据湖探索SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
创建DLI自定义委托权限 - 数据湖探索 DLI

所有资源：授权后，IAM用户可以根据权限使用账号中所有资源，包括企业项目、区域项目和全局服务资源。全局服务资源：全局服务部署时不区分区域，访问全局级服务，不需要切换区域，全局服务不支持基于区域项目授权。如对象存储服务（OBS）、内容分发网络（CDN）等。授权后，用户根据权限使用全局服务的资源。指定区

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
Python SDK环境配置 - 数据湖探索 DLI

zip”解压目录下的windows目录。例如：“D:\tmp\dli-sdk-python-1.0.8”。执行如下命令安装DLI服务Python SDK，安装过程中会自动下载第三方依赖库。 python setup.py install 运行结果参见图2所示。图2 安装Python SDK Python开发环境配置

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

每次从数据库拉取数据的行数。若指定为0，则会忽略sql hint。 scan.auto-commit 否 true Boolean 是否设置自动提交，以确定事务中的每个statement是否自动提交 pwd_auth_name 否无 String DLI侧创建的Password类型的跨源认证名称。用户若配

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

实例的CPU和内存。不同性能规格对应不同连接数和最大IOPS。 2vCPUs | 4GB 存储空间如果存储类型为SSD云盘或极速型SSD，可设置存储空间自动扩容，当存储空间可用率过小时，会自动扩容存储空间。 40GB 磁盘加密选择是否开启磁盘加密功能。不加密虚拟私有云选择已有的虚拟私有云。如需重新创建

 帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

完成以上步骤后，就可以开始进行数据查询了。单击“SQL编辑器”页面左侧的“数据库”页签，选择新创建的表table1，双击表，在右侧编辑窗口中，自动输入SQL查询语句，例如查询table1表的1000条数据： select * from db1.table1 limit 1000; 单击“执行”，系统开始查询。

帮助中心 > 数据湖探索 DLI > 快速入门
配置多版本过期数据回收站 - 数据湖探索 DLI

注意事项 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。回收站数据自动清理需要在OBS并行文件系统的桶上配置回收站数据的生命周期规则。具体步骤参考如下：在OBS服务控制台页面左侧选择“并行文件系统”，单击对应的文件系统名称。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
创建DLI表关联DDS - 数据湖探索 DLI

使用跨源密码认证时配置为“true”。如果在DDS中已存在collection，则建表可以不指定schema信息，DLI会根据collection中的数据自动生成schema信息。示例 1 2 3 4 5 6 create table 1_datasource_mongo.test_momgo(id

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否访问数据库所需要的账号 connector.password 否访问数据库所需要的密码

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否数据库认证用户名，需要和'connector.password'一起配置 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Flink作业推荐配置指导 - 数据湖探索 DLI

Exactly Once模式保证每条数据只被消费一次，At Least Once模式每条数据至少被消费一次，请依据业务情况选择。勾选“异常自动恢复”和“从Checkpoint恢复”，根据自身业务情况选择重试次数。配置“脏数据策略”，依据自身的业务逻辑和数据特征选择忽略、抛出异常或者保存脏数据。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建SQL作业模板 - 数据湖探索 DLI

在管理控制台左侧，单击“作业模板”>“SQL模板”。在“SQL模板”页面，勾选相应的模板，单击“操作”列的“执行”，将跳转至“SQL编辑器”页面，并在SQL作业编辑窗口中自动输入对应的SQL语句。在SQL作业编辑窗口右上方，单击“执行”运行SQL语句，执行结束后，可以在SQL作业编辑窗口下方区域中查看执行结果。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板

总条数： 407

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表初始化 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线