搜索_华为云

Spark SQL常用配置项说明 - 数据湖探索 DLI

true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Elasticsearch结果表 - 数据湖探索 DLI

、密码password、证书位置certificate。请注意该场景hosts字段值以https开头。 CSS集群安全组入向规则必须开启ICMP。数据类型的使用，请参考Format章节。提交Flink作业前，建议勾选“保存作业日志”参数，在OBS桶选项中选择日志保存的位置，方

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DLI的计费模式有哪些？ - 数据湖探索 DLI

需计费。存储套餐的额度每个小时会重置。数据扫描量按需计费扫描量计费=单价*扫描量数据（GB）扫描数据量套餐包购买了扫描数据量套餐包，按需使用过程中优先抵扣扫描数据量套餐包的规格额度，超过扫描数据量套餐包额度的按照按需计费。扫描数据量套餐的额度会按订购周期重置。创建队列的操作指导请参考：创建队列

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
原生数据类型 - 数据湖探索 DLI

BIGINT/LONG 有符号整数 8字节 -9223372036854775808～9223372036854775807 是是 TIMESTAMP 时间戳，表示日期和时间，格式为原始数据。例如：1621434131222 - - 是是 CHAR 固定长度字符串 - - 是是 VARCHAR

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
增强型跨源连接概述 - 数据湖探索 DLI

使用DLI增强型跨源时，弹性资源池/队列的网段与数据源网段不能重合。访问跨源表需要使用已经创建跨源连接的队列。跨源表不支持Preview预览功能。检测连通性要求检测跨源连接的连通性时对IP约束限制如下： IP必须为合法的IP地址，用“.”分隔的4个十进制数，范围是0-255。测试时IP地址后

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

offset:42;partition:1,offset:300'。 connector.startup-timestamp-millis 否指定起始消费时间戳，'startup-mode'为'timestamp'时需配置。 connector.properties.* 否配置kafka任意原生属性。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

TIME ZONE NOT NULL R/W Kafka 记录的时间戳。 timestamp-type STRING NOT NULL R Kafka 记录的时间戳类型： NoTimestampType：消息中没有定义时间戳。 CreateTime：消息产生的时间。 LogAppendTime：消息被添加到Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
SQL作业运行慢如何定位 - 数据湖探索 DLI

SQL作业运行慢如何定位作业运行慢可以通过以下步骤进行排查处理。可能原因1：FullGC原因导致作业运行慢判断当前作业运行慢是否是FullGC导致：登录DLI控制台，单击“作业管理 > SQL作业”。在SQL作业页面，在对应作业的“操作”列，单击“更多 > 归档日志”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建表（废弃） - 数据湖探索 DLI

时填写。 timestamp_format 否 String 用户自定义时间类型。默认格式为“yyyy-MM-dd HH:mm:ss”。时间戳格式字符定义详见表3。只有CSV和JSON类型数据具有该属性。data_location为OBS时填写。 tags 否 Array of Objects

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

TIME ZONE NOT NULL R/W Kafka消息的时间戳。 timestamp-type STRING NOT NULL R Kafka消息的时间戳类型： NoTimestampType：消息中没有定义时间戳。 CreateTime：消息产生的时间。 LogAppendTime：消息被添加到Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

ive'，否则在HiveCatalog中一个表默认被认为是通用的。注意，如果使用Hive方言，就不需要connector属性。监视策略是扫描当前位置路径中的所有目录/文件。许多分区可能会导致性能下降。对未分区表进行流式读取时，要求将每个文件以原子方式写入目标目录。分区表的流式读取要求在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
普通队列弹性扩缩容 - 数据湖探索 DLI

普通队列弹性扩缩容前提条件新创建的按需计费队列需要运行作业后才可进行弹性扩缩容。本节操作仅适用于普通队列，不适用于弹性资源池队列。约束与限制 16CUs队列不支持扩容和缩容。 64CUs队列不支持缩容。目前只支持计费模式为“按需/CU时”和“按需/专属资源模式”的队列进行弹性扩缩容。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

数及参数值。商用创建批处理作业API 2020年5月序号功能名称功能描述阶段相关文档 1 支持数据扫描量套餐包 DLI增加数据扫描量套餐包，降低数据扫描量费用。商用产品价格详情 2 支持全局变量功能 DLI支持设置全局变量，用于保护用户关键信息。商用全局变量

 帮助中心 > 数据湖探索 DLI > 最新动态
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

该场景下就需要使用REFRESH TABLE来解决该问题。REFRESH TABLE是用于重新整理某个分区的文件，重用之前的表元数据信息，能够检测到表的字段的增加或者减少，主要用于表中元数据未修改，表的数据修改的场景。语法格式 1 REFRESH TABLE [db_name.]table_name;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
查看SQL执行计划 - 数据湖探索 DLI

SQL执行计划是数据库查询的逻辑流程图，它展示了数据库管理系统如何执行一个特定的SQL查询。执行计划详细列出了执行查询所需的各个步骤，例如表扫描、索引查找、连接操作（如内连接、外连接）、排序和聚合等。执行计划可以帮助分析查询的性能，识别可能的性能瓶颈，通过了解查询的执行逻辑，并根据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
提交SQL作业（推荐） - 数据湖探索 DLI

true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

任务并行读取时如何对表进行分区。 scan.partition.column：用于对输入进行分区的列名，该列的数据类型必须是数字，日期或时间戳。 scan.partition.num: 分区数。 scan.partition.lower-bound：第一个分区的最小值。 scan

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hudi结果表 - 数据湖探索 DLI
Hudi结果表 - 数据湖探索 DLI

String 同步到Hive的数据库名称。 hive_sync.support_timestamp 否 true Boolean 是否支持时间戳。建议值为True。 changelog.enabled 否 false Boolean 是否消费所有变更（包含中间变更）。参数取值如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

位点开始读取。位点可通过 binlog 文件名和位置指定，或者在 GTID 在集群上启用时通过 GTID 集合指定。 timestamp：跳过快照阶段，从指定的时间戳开始读取 binlog 事件。 scan.startup.specific-offset.file 否无 String 在 "specific-offset"

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略场景介绍一个企业有多个部门，多个部门不同业务数据分析的时间段可能有所差异，具体场景如下： A部门：在00:00-09:00时间段内资源请求量大，其他时间段有短时间的资源请求量不大的任务运行。 B部门：在10:00-22:00时间段内资

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列

总条数： 349

上一页
1
...
5
6
7
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL常用配置项说明 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

DLI的计费模式有哪些？ - 数据湖探索 DLI

原生数据类型 - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

查看SQL执行计划 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

Hudi结果表 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线