搜索_华为云

创建Bucket索引表调优 - 数据湖探索 DLI

创建Bucket索引表调优创建Bucket索引表调优 Bucket索引常用设置参数： Spark： hoodie.index.type=BUCKET hoodie.bucket.index.num.buckets=5 Flink index.type=BUCKET hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
使用DataSource语法创建DLI表 - 数据湖探索 DLI

使用DataSource语法创建DLI表功能描述使用DataSource语法创建DLI表。DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。注意事项 CTAS建表语句不能指定表的属性。若没有指定分隔符，则默认为逗号（

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

Raw Format 功能描述 Raw format 允许读写原始（基于字节）值作为单个列。 Raw Format将 null 值编码成 byte[] 类型的 null。这样在 upsert-kafka 中使用时可能会有限制，因为 upsert-kafka 将 null 值视为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
管理DLI全局变量 - 数据湖探索 DLI

管理DLI全局变量什么是全局变量 DLI支持在管理控制台设置全局变量，将作业开发过程中频繁使用的变量设置为全局变量，可以避免在编辑作业过程中重复定义，减少开发与维护成本。通过使用全局变量可以替换长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移Elasticsearch类型的CSS集群数据至DLI。其他自建的Elasticsearch等服务数据，均可以通过CDM与DLI进行双向同步。前提条件已创建DLI的SQL队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

删除分区功能描述本节操作介绍删除分区表的一个或多个分区。分区表分为两种，OBS表和DLI表。在删除分区时，DLI表和OBS表都支持利用指定条件删除分区表的一个或多个分区。OBS表还支持按指定筛选条件删除分区。注意事项所要删除分区的表必须是已经存在的表，否则会出错。所要

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

DIS源表功能描述创建source流从数据接入服务（DIS）获取数据。用户数据从DIS接入，Flink作业从DIS的通道读取数据，作为作业的输入数据。Flink作业可通过DIS的source源将数据从生产者快速移出，进行持续处理，适用于将云服务外数据导入云服务后进行过滤、实时分析、监控报告和转储等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 Beeline是数据分析师和数据工程师的重要工具之一，适用于大规模数据处理的场景。Beeline提供了的SQL引擎，使得用户可以使用SQL的语言来执行数据查询、数据分析和管理任务。 Kyuubi是一个分布式 SQL

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
使用Hive语法创建DLI表 - 数据湖探索 DLI

使用Hive语法创建DLI表功能描述使用Hive语法创建DLI表。DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。注意事项 CTAS建表语句不能指定表的属性。 Hive DLI表不支持在建表时指定多字符的分隔符。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
本文样例表数据准备 - 数据湖探索 DLI

本文样例表数据准备 --创建具有TINYINT类型数据的表。 CREATE TABLE int_type_t1 (IT_COL1 TINYINT) ; --插入TINYINT类型数据 insert into int_type_t1 values (TINYINT'10');

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > 附录
Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch结果表功能描述 DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境自定义镜像应用场景通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

Redis源表功能描述创建source流从Redis获取数据，作为作业的输入数据。前提条件创建该作业前，需要建立DLI和Redis的增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

Redis维表功能描述创建Redis表作为维表用于与输入流连接，从而生成相应的宽表。前提条件要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略场景介绍一个企业有多个部门，多个部门不同业务数据分析的时间段可能有所差异，具体场景如下： A部门：在00:00-09:00时间段内资源请求量大，其他时间段有短时间的资源请求量不大的任务运行。 B部门：在10:00-22:00时间段内资

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka 概述本节操作介绍使用Flink Jar连接开启SASL_SSL认证的Kafka的操作方法。如需使用Flink OpenSource SQL连接开启SASL_SSL认证的Kafka，请参考Flink SQL语法参考-Kafka源表。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
与其他云服务的关系 - 数据湖探索 DLI

与其他云服务的关系与对象存储服务（OBS）的关系对象存储服务（Object Storage Service）作为DLI的数据来源及数据存储，与DLI配合一起使用，关系有如下四种。数据来源：使用DLI服务提供API，将OBS对应路径的数据导入到DLI。具体API请参考《导入数据》。

帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 697

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Bucket索引表调优 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

本文样例表数据准备 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线