搜索_华为云

JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

该示例是从kafka的一个topic中读取数据，并使用kafka sink将数据写入到kafka的另一个topic中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

以计算一组行的 “COUNT”、“SUM”、“AVG”（平均）、“MAX”（最大）和 “MIN”（最小）。对于流式查询，用于计算查询结果的状态可能无限膨胀。状态的大小大多数情况下取决于去重行的数量和分组持续的时间，持续时间较短的 group 窗口不会产生状态过大的问题。可以提供一个合适的状态

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Hudi表分区设计规范 - 数据湖探索 DLI

分区粒度可以采用年、月、日，分区粒度的目标是减少同时写入的文件桶数，尤其是在有数据量更新，且更新数据有一定时间范围规律的，比如：近一个月的数据更新占比最大，可以按照月份创建分区；近一天内的数据更新占比大，可以按照天进行分区。采用Bucket索引，写入是通过主键Hash打散的，数据会均匀的写入到分区下每

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

在使用join进行多表关联查询时，不管表数据量大小，join时都需要指定on条件来减少多表关联的数据量，从而减轻队列的负荷，提升查询效率。例如，问题现象中的问题语句可以根据业务场景，在join时通过指定on条件来进行优化，这样会极大减少关联查询的结果集，提升查询效率。 select case

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
配置Hudi数据列默认值 - 数据湖探索 DLI

历史数据的默认值与列第一次设置的默认值一致，多次修改列的默认值不会影响历史数据的查询结果。设置默认值后rollback不能回滚默认值配置。 Spark SQL暂不支持查看列默认值信息，可以通过执行show create table SQL查看。不支持默认缺省列的写入方式，写入时必须指定列名。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
Hudi数据表Clean规范 - 数据湖探索 DLI

delta_commits的值）。 MOR表下游采用流式计算，历史版本保留小时级。如果MOR表的下游是流式计算，例如Flink流读，可以按照业务需要保留小时级的历史版本，这样的话近几个小时之内的增量数据可以通过log文件读出，如果保留时长过短，下游flink作业在重启或者异常中断阻塞的情况下，上

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

添加到弹性资源池中的队列不再单独计费，以弹性资源池为计费项计费：按需计费模式：按弹性资源池的实际CUs计费。包年/包月计费模式：按弹性资源池的实际CUs计费，其中规格部分包年/包月，超出规格的部分按需计费。弹性资源池CU时套餐包：按购买的套餐包周期价格扣费，其中套餐包内的规格包周期计费，超出套餐包规格的部分按需计费。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否访问数据库所需要的账号 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

用于展示表或分区的详细信息。可以使用规则运算表达式来同时匹配多个表，但不可用于匹配分区。展示的信息将包括表的基本信息和相关的文件系统信息，其中文件系统信息包括总文件数、总文件大小、最大文件长度、最小文件长度、最后访问时间以及最后更新时间。如果指定了分区，将给出指定分区的文件系统信息，而不是分区所在表的文件系统信息。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

指定日期减去目标天数后的日期，数据类型为STRING。 TIME string TIME 以“HH:mm:ss”的形式返回从字符串解析的 SQL 时间。 TIMESTAMP string TIMESTAMP 以“yyyy-MM-dd HH:mm:ss[.SSS]”的形式返回从字符串解析的 SQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
SQL作业运维类 - 数据湖探索 DLI

Buffer size too small. size SQL作业运行报错：DLI.0002 FileNotFoundException 用户通过CTAS创建hive表报schema解析异常错误在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
EXPLAIN - 数据湖探索 DLI
EXPLAIN - 数据湖探索 DLI

HASH Fragment会在固定数量的节点上执行，输入数据通过哈希函数进行分布。 ROUND_ROBIN Fragment会在固定数量的节点上执行，片段在固定数量的节点上执行，输入数据以轮循方式进行分布。 BROADCAST Fragment会在固定数量的节点上执行，输入数据被广播到所有的节点。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
数学函数和运算符 - 数据湖探索 DLI

返回x的以2为底的对数 select log2(4);-- 2.0 log10(x) → double 返回x的以10为底的对数 select log10(1000);-- 3.0 log(b, x) → double 返回x的以b为底的对数 select log(3,81); -- 4.0 mod(n

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

Spark：显示执行引擎为“Spark”的作业。 HetuEngine：显示执行引擎为“HetuEngine”的作业。用户名执行该作业的用户名。类型作业的类型，包括如下。 IMPORT：导入数据到DLI的作业。 EXPORT：从DLI导出数据的作业。 DCL：包括传统DCL，以及队列权限相关的操作。 D

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试地址连通性-->输入kafka的地址-->测试）。若能连

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
字符串函数和运算符 - 数据湖探索 DLI

这些函数假定输入字符串包含有效的UTF-8编码的Unicode代码点。不会显式检查UTF-8数据是否有效，对于无效的UTF-8数据，函数可能会返回错误的结果。可以使用from_utf8来更正无效的UTF-8数据。此外，这些函数对Unicode代码点进行运算，而不是对用户可见的字符（或字形群集

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

Studio-DLF调度。自建大数据生态的调度工具，如Airflow。企业级多租户基于表的权限管理，可以精细化到列权限。基于文件的权限管理。高性能性能基于软硬件一体化的深度垂直优化。大数据开源版本性能。跨源分析支持多种数据格式，云上多种数据源、ECS自建数据库以及线下数据库，

帮助中心 > 数据湖探索 DLI > 产品介绍
使用Hive语法创建OBS表 - 数据湖探索 DLI

示例3：使用CTAS语句将源表的全部数据或部分数据创建新的OBS表示例说明：根据示例1：创建OBS非分区表中创建的OBS表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不论在创建t

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Spark SQL常用配置项说明 - 数据湖探索 DLI

剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
创建JDBC维表 - 数据湖探索 DLI
创建JDBC维表 - 数据湖探索 DLI

connector，必须为jdbc connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否数据库认证用户名，需要和'connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表

总条数： 766

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

JSON Format - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

SQL作业运维类 - 数据湖探索 DLI

EXPLAIN - 数据湖探索 DLI

数学函数和运算符 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

创建JDBC维表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线