搜索_华为云

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi数据表Clean规范 Clean也是Hudi表的维护操作之一，该操作对于MOR表和COW表都需要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

审计与日志 DLI对接云审计服务云审计服务（Cloud Trace Service，CTS），是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 CTS可记录的DLI操作列表

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 1. 添加如下依赖 <dependency> <groupId>io.delta</groupId> <artifactId>delta-core_2.12</artifactId> <version>2.3

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
添加分区（只支持OBS表） - 数据湖探索 DLI

添加分区（只支持OBS表）功能描述创建OBS分区表成功后，OBS表实际还没有生成分区信息。生成分区信息主要有以下两种场景：给OBS分区表插入对应的分区数据，数据插入成功后OBS表才会生成分区元数据信息，后续则可以根据对应分区列进行查询等操作。手工拷贝分区目录和数据到OBS

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
创建DLI表关联DCS - 数据湖探索 DLI

创建DLI表关联DCS 功能描述使用CREATE TABLE命令创建DLI表并关联DCS上已有的Key。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？场景概述用户使用Flink SQL作业时，需要创建OBS分区表，用于后续进行批处理。操作步骤该示例将car_info数据，以day字段为分区字段，parquet为编码格式，转储数据到OBS。更多内容请参考《数据湖探索Flink SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

指定数据库： “表结构模式”可填写需访问的数据库名称，如果填写，后续创建数据集时，刷新表，页面上只可见该数据库下的表。如果不填写，后续创建数据集时，刷新表，页面上会显示所有数据库下的表。其他选项不需要填写，也无需勾选“需要登录”选项。图1 添加数据源配置表2 数据库连接参数

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
插入数据至DDS表 - 数据湖探索 DLI

插入数据至DDS表功能描述 INSERT INTO命令将DLI表中的数据插入到已关联的指定DDS表中。语法格式将SELECT查询结果插入到表中： 1 2 3 4 5 6 7 INSERT INTO DLI_TABLE SELECT field1,field2... [FROM

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
隐式转换对照表 - 数据湖探索 DLI

隐式转换对照表当数据类型不匹配时会隐式转换，但并是不是所有的数据类型都支持隐式转换。以下为当前隐式转换功能支持的数据类型转换表：表1 隐式转换对照表 - BOOLEAN TINYINT SMALLINT INTEGER BIGINT REAL DOUBLE DECIMAL VARCHAR

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > 数据类型隐式转换
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范写作业未停止情况下，禁止手动执行run schedule命令生成compaction计划。错误示例： run schedule on dsrTable 如果还有别的任务在写这张表，执行该操作会导致数据丢失。执行run

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

在default队列执行DLI SQL失败，提示超时异常怎么办？问题现象使用default队列提交SQL作业，作业运行异常，排查作业日志显示Execution Timeout异常。异常日志参考如下： [ERROR] Execute DLI SQL failed. Please

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
执行SQL查询语句报错：DLI.0003: Permission denied for resource.... - 数据湖探索 DLI

执行SQL查询语句报错：DLI.0003: Permission denied for resource.... 问题现象执行SQL查询语句，提示没有对应资源查询权限。报错信息：DLI.0003: Permission denied for resource 'databases

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
DLI SDK功能矩阵 - 数据湖探索 DLI

SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询指定资源包、删除资源包的Java SDK使用说明。 SQL作业相关介绍数据库相关、表相关、作业相关Java SDK使用说明。 Flink作业相关介绍新建Flink作业、查询作业详情、查询作业列表等Java SDK使用说明。

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
创建经典型跨源连接 - 数据湖探索 DLI

空格和_ . : =+-@ ,但首尾不能含有空格。表4 各服务URL获取方式服务名称 URL获取方式 Cloud Table HBase OpenTSDB DWS RDS CSS MRS 响应消息表5 响应参数参数名称是否必选参数类型说明 is_success 否 Boolean

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
创建DLI表关联OpenTSDB - 数据湖探索 DLI

创建DLI表关联OpenTSDB 功能描述使用CREATE TABLE命令创建DLI表并关联OpenTSDB上已有的metric，该语法支持CloudTable服务的OpenTSDB和MRS服务的OpenTSDB。前提条件创建DLI表关联OpenTSDB之前需要创建跨源连接。管理控制台操作请参考增强型跨源连接。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表

总条数： 1232

上一页
1
...
52
53
54
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

插入数据至DDS表 - 数据湖探索 DLI

隐式转换对照表 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

执行SQL查询语句报错：DLI.0003: Permission denied for resource.... - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

创建经典型跨源连接 - 数据湖探索 DLI

创建DLI表关联OpenTSDB - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线