搜索_华为云

Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
BI工具连接DLI方案概述 - 数据湖探索 DLI

用。通过连接到DLI，BI工具可以更加灵活的使用DLI访问和分析数据，帮助企业快速做出基于数据的决策。 DLI为BI工具提供了便捷的连接方法： DBeaver、DBT和YongHong BI，可以直接通过DLI提供的驱动连接到DLI。这简化了配置过程，使得用户能够直接利用这些工具的强大功能。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
队列权限管理 - 数据湖探索 DLI

为已有权限的用户赋予权限或回收权限。在对应队列“权限信息”区域的用户列表中，选择需要修改权限的用户，在“操作”列单击“权限设置”。在队列“权限设置”对话框中，对当前用户具备的权限进行修改。详细权限描述如表1所示。当“权限设置”中的选项为灰色时，表示您不具备修改此队列权限的权限。可以向管理员用户、队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表模型设计规范规则 Hudi表必须设置合理的主键。 Hudi表提供了数据更新和幂等写入能力，该能力要求Hudi表必须设置主键，主键设置不合理会导致数据重复。主键可以为单一主键也可以为复合主键，两种主键类型均要求主键不能有null值和空值，可以参考以下示例设置主键： SparkSQL： //

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
创建表时指定表的生命周期 - 数据湖探索 DLI

生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。生命周期设置后，DLI表和OBS表支持数据备份，OBS表的备份目录需要手工设置。且备份目录应选择在并行文件系统上，备份目录必须和原表目录在同一个桶上，备份目录不能与原表相同目录或者子目录同名。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

TABLESAMPLE 有BERNOULLI和SYSTEM两种采样方法。这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
创建DLI表关联RDS - 数据湖探索 DLI

partitionColumn 读取数据时，用于设置并发使用的数值型字段。说明： “partitionColumn”、“lowerBound”、“upperBound”、“numPartitions”四个参数必须同时设置，不支持仅设置其中某一个或某几个。为了提升并发读取的性能，建议使用自增列。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
修改弹性资源池的主机信息 - 数据湖探索 DLI

单击“确定”，完成主机信息的修改。怎样获取MRS主机信息? 方法一：在管理控制台查看MRS主机信息获取MRS集群主机名与IP地址，以MRS3.x集群为例，步骤如下：登录MRS管理控制台页面。单击“集群列表 > 现有集群”，在集群列表中单击指定的集群名称，进入集群信息页面。选择“组件管理”页签；

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。例如访问DWS大批量数据库数据时设置并发数，启动多任务的方式运行，避免作业运行超时。具体并发设置可以参考对接DWS样例代码中的partitionC

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
创建DLI表关联DWS - 数据湖探索 DLI

partitionColumn 读取数据时，用于设置并发使用的数值型字段。说明： “partitionColumn”、“lowerBound”、“upperBound”、“numPartitions”四个参数必须同时设置，不支持仅设置其中某一个或某几个。为了提升并发读取的性能，建议使用自增列。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

初始化consumer/producer都是在taskmanager里执行的，所以需要获取到taskmanager对应container下truststore文件的路径，在初始化前将其引入properties中才能生效。 kafka source可以在open里引入。图1 获取kafka

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
COMMENT - 数据湖探索 DLI
COMMENT - 数据湖探索 DLI

COMMENT 语法 COMMENT ON TABLE name IS 'comments' 描述设置表的注释信息，可以通过设置注释信息为NULL来删除注释。示例修改表users的注释为“master table”，表的注释语句可以通过show create table tablename语句查看：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。若需要获取key的值，则可以通过在Fli

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

续排查其他可能原因。检查是否在域名或者IP后添加了端口检查是否连接的是对端VPC和子网检查队列的网段是否与数据源网段是否重合检查是否为DLI授权了DLI Datasource Connections Agency Access权限检查对端安全组是否放通队列的网段检查增强型跨源连接对应的对等连接的路由信息

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

图1 设置凭据值按需完成其他参数的配置后，单击“确定”保存凭据。了解更多请参考创建通用凭据。在DLI作业中使用DEW中创建的凭据以Flink作业为例介绍使用DEW凭据的方法。参考Flink Opensource SQL使用DEW管理访问凭据的语法格式，在作业中配置凭据信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
DLI Delta常见问题 - 数据湖探索 DLI

predicate on partitioned table `777dd`.`test_delta_parts1` 解决方案：在console页面设置中添加参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled值为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
Spark作业开发类 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。同步数据库数据的客户端，都会有一个唯一ID，即Server ID。同一个数据库下，建议每个MySQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 463

上一页
1
...
4
5
6
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi存储结构 - 数据湖探索 DLI

BI工具连接DLI方案概述 - 数据湖探索 DLI

队列权限管理 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

COMMENT - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

DLI Delta常见问题 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线