搜索_华为云

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询和分析 Beeline是数据分析师和数据工程师的重要工具之一，适用于大规模数据处理的场景。Beeline提供了的SQL引擎，使得用户可以使用SQL的语言来执行数据查询、数据分析和管理任务。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Spark作业使用咨询 - 数据湖探索 DLI

如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。查看Spark内置依赖包的版本请参考内置依赖包。资源包管理中的包是否能够下载? 资源包仅提供托管服务，不提供下载功能。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

分位数（Quantile），亦称分位点，是指将一个随机变量的概率分布范围分为几个等份的数值点，常用的有中位数（即二分位数）、四分位数、百分位数等。quantile digest是一个分位数的集合，当需要查询的数据落在某个分位数附近时，就可以用这个分位数做为要查询数据的近似值。它的精度可以调节，但更高精度的结果会带来空间的昂贵开销。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

询和分析 Superset是一个开源的数据探索和可视化平台，支持对数据进行快速、直观的探索，同时支持创建丰富的数据可视化和交互式仪表板。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通过将Supers

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
数学运算函数 - 数据湖探索 DLI

关系运算符所有数据类型都可用关系运算符进行比较，并返回一个BOOLEAN类型的值。关系运算符均为双目操作符，被比较的两个数据类型必须是相同的数据类型或者是可以进行隐式转换的类型。 Flink SQL提供的关系运算符，请参见表1。表1 关系运算符运算符返回类型描述 A = B

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
查看所有数据库 - 数据湖探索 DLI

regex_expression 数据库名称。注意事项 DATABASES与SCHEMAS是等效的，都将返回所有的数据库名称。示例查看当前的所有数据库。 1 SHOW DATABASES; 查看当前的所有以test开头的数据库。 1 SHOW DATABASES LIKE "test.*";

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

本节操作介绍删除分区表的一个或多个分区。分区表分为两种，OBS表和DLI表。在删除分区时，DLI表和OBS表都支持利用指定条件删除分区表的一个或多个分区。OBS表还支持按指定筛选条件删除分区。注意事项所要删除分区的表必须是已经存在的表，否则会出错。所要删除的分区必须是已经存在的，否则会出错，可通过语句中添加“IF

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
查询RDS表 - 数据湖探索 DLI
查询RDS表 - 数据湖探索 DLI

SELECT命令用于查询RDS表中的数据。语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则会出错。示例查询表test_ct中的数据。 1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
查询CSS表 - 数据湖探索 DLI
查询CSS表 - 数据湖探索 DLI

SELECT命令用于查询CSS表中的数据。语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则会出错。示例查询表dli_to_css中的数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
DLI对接LakeFormation - 数据湖探索 DLI

优先推荐您使用控制台提供的“元数据来源”参数项进行配置。 Lakeformation 数据目录名称配置Spark作业访问的数据目录名称。此处选择的是在DLI管理控制台创建的数据目录，即DLI与Lakeformation默认实例下的数据目录的映射，该数据目录连接的是LakeForma

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
查询DWS表 - 数据湖探索 DLI
查询DWS表 - 数据湖探索 DLI

SELECT命令用于查询DWS表中的数据。语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则会出错。示例查询表dli_to_dws中的数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

schema_name 描述 DATABASE和SCHEMA在此处是等价的，可互换的，它们有这相同的含义。该语法用于显示SCHEMA的名称、注释、还有它在文件系统上的根路径。可选项EXTENDED可以用来显示SCHEMA的数据库属性。示例 CREATE SCHEMA web;

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
Flink作业性能调优 - 数据湖探索 DLI

出，说明的是该消费组当前待消费的数据总量。如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择“云服务监控 > 分布式消息服务 > kafka专享版” ，单击“kafka实例名称 > 消费组” ，选择具体的消费组名称，查看消费组的指标信息。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
通过DLI跨源写DWS表，非空字段出现空值异常怎么办？ - 数据湖探索 DLI

原因分析 DLI源表对应字段cir为double类型。图1 创建源表目标表对应字段类型为decimal(9,6)。图2 创建目标表查询源表数据，发现导致问题产生的记录ctr值为1675，整数位（4位）超出所定义的decimal精度（9 – 6 = 3位），导致doubl

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试地址连通性-->输入kafka的地址-->测试）。若能连

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

db_name 需要执行INSERT命令的表所在数据库的名称。 table_name 需要执行INSERT命令的表的名称。 part_spec 指定详细的分区信息。若分区字段为多个字段，需要包含所有的字段，但是可以不包含对应的值，系统会匹配上对应的分区。单表分区数最多允许100000个。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

写DLI队列的网段。单击“确定”完成配置。图7 安全组规则检查增强型跨源连接对应的对等连接的路由信息检查增强型跨源连接对应的对等连接的路由表，该路由表的本端路由地址网段是否和别的网段有重合，如果重合，路由可能转发错误。获取增强型跨源连接创建的对等连接ID。图8 获取对等连接ID

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类

总条数： 914

上一页
1
...
8
9
10
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

查看所有数据库 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

查询RDS表 - 数据湖探索 DLI

查询CSS表 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

查询DWS表 - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

通过DLI跨源写DWS表，非空字段出现空值异常怎么办？ - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线