搜索_华为云

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

包冲突，导致作业提交失败问题描述用户Flink程序的依赖包与DLI Flink平台的内置依赖包冲突，导致提交失败。解决方案首先您需要排除是否有冲突的Jar包。含DLI Flink提供了一系列预装在DLI服务中的依赖包，用于支持各种数据处理和分析任务。如果您上传的Jar包中包含DLI

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
DML语法定义 - 数据湖探索 DLI
DML语法定义 - 数据湖探索 DLI

'}' ['?'] | '{' repeat '}' 注意事项 Flink SQL 对于标识符（表、属性、函数名）有类似于 Java 的词法约定: 不管是否引用标识符，都保留标识符的大小写。且标识符需区分大小写。与 Java 不一样的地方在于，通过反引号，可以允许标识符带有非字母的字符（如："SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义
DML语法定义 - 数据湖探索 DLI
DML语法定义 - 数据湖探索 DLI

'}' ['?'] | '{' repeat '}' 注意事项 Flink SQL 对于标识符（表、属性、函数名）有类似于 Java 的词法约定: 不管是否引用标识符，都保留标识符的大小写。且标识符需区分大小写。与 Java 不一样的地方在于，通过反引号，可以允许标识符带有非字母的字符（如："SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义
普通队列弹性扩缩容 - 数据湖探索 DLI

需要等待大约10分钟，具体时长和扩容的CU值有关，等待一段时间后，可以通过刷新“队列管理”页面，对比“规格”和“实际CUs”大小是否一致来判断是否扩容成功。或者在“作业管理”页面，查看“SCALE_QUEUE”类型SQL作业的状态，如果作业状态为“弹性扩缩容中”，表示队列正在扩容中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
condition - 数据湖探索 DLI
condition - 数据湖探索 DLI

“_”仅代表一个字符。 attr_expr 属性表达式。 attrs_value_set_expr 属性值集合。 in 关键字，用于判断属性是否在一个集合中。 const_string 字符串常量。 const_int 整型常量。 ( 指定常量集合开始。 ) 指定常量集合结束。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表在导入数据时，如果文件数据没有包含分区字段，则系统会默认指定分区值“__HIVE_DEFAULT_PARTITION__”，当前Spark判断分区为空时，则会直接返回null，不返回具体的数据。解决方案登录DLI管理控制台，在“SQL编辑器”中，单击“设置”。在参数设置中，添加参数“spark

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
与其他云服务的关系 - 数据湖探索 DLI

语法将日常作业的查询结果数据存放到CSS表中。通过DLI跨源连接访问DWS数据请参考《跨源分析开发方式参考》。与分布式缓存服务（DCS）的关系分布式缓存服务（Distributed Cache Service）作为DLI的数据来源及数据存储，与DLI配合一起使用，关系有如下两种。

帮助中心 > 数据湖探索 DLI > 产品介绍
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

max-rows 否 100 Integer 每次写入请求缓存的最大行数。它能提升写入数据的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。 sink.buffer-flush.interval 否 1s Duration 刷新缓存的间隔，在这段时间内以异步线程刷新数据。它能提升写入数据的性能，但是也可能增加延迟。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
变更普通队列规格 - 数据湖探索 DLI

需要等待大约10分钟，具体时长和扩容的CU值有关，等待一段时间后，可以通过刷新“队列管理”页面，对比“规格”和“实际CUs”大小是否一致来判断是否扩容成功。或者在“作业管理”页面，查看“SCALE_QUEUE”类型SQL作业的状态，如果作业状态为“规格变更中”，表示队列正在扩容中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
手动续费 - 数据湖探索 DLI
手动续费 - 数据湖探索 DLI

数据湖探索 DLI”。在队列或弹性资源池的列表页，选中待续费的包年/包月资源。单击“操作”列下的“更多 > 续费”。选择续费时长，判断是否勾选“统一到期日”，将到期时间统一到各个月的某一天（详细介绍请参见统一包年/包月资源的到期日）。确认配置费用后单击“去支付”。图1 续费确认

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

sink.buffer-size 256 * 1024 否缓存流加载数据的缓冲区大小。 sink.buffer-count 3 否缓存流加载数据的缓冲区计数。 sink.enable-delete TRUE 否是否启用删除。此选项需要 Doris 表开启批量删除功能(Doris0

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Doris维表 - 数据湖探索 DLI
Doris维表 - 数据湖探索 DLI

cache.max-rows -1L N 查找缓存的最大行数，超过此值，最旧的行将被删除。如需启用缓存配置则“cache.max-rows”和“cache.ttl”选项都必须指定。 lookup.cache.ttl 10 s N 缓存生存时间。 lookup.max-retries

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
DWS结果表（不推荐使用） - 数据湖探索 DLI

max-rows 否 100 Integer 每次写入请求缓存的最大行数。它能提升写入数据的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。 sink.buffer-flush.interval 否 1s Duration 刷新缓存的间隔，在这段时间内以异步线程刷新数据。它能提

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

max-rows 否 100 Integer 每次写入请求缓存的最大行数。它能提升写入数据的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。 sink.buffer-flush.interval 否 1s Duration 刷新缓存的间隔，在这段时间内以异步线程刷新数据。它能提

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Flink作业性能调优类 - 数据湖探索 DLI

Flink作业推荐配置指导 Flink作业性能调优 Flink作业重启后，如何保证不丢失数据？ Flink作业运行异常，如何定位 Flink作业重启后，如何判断是否可以从checkpoint恢复 DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

Hudi表的分区字段。无分区表不指定，分区表必须指定 write.precombine.field 是无 String 数据合并字段基于此字段的大小来判断消息是否进行更新。如果您没有设置该参数，则系统默认会按照消息在引擎内部处理的先后顺序进行更新。 write.payload.class 否无

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.partitions参数值来解决缓冲区不足问题。具体该参数设置步骤如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

sink.buffer-flush.max-rows 否 0 Integer 缓存刷新前，最多能缓存的记录条数。当sink收到很多同key上的更新时，缓存将保留同 key 的最后一条记录，因此sink缓存能帮助减少发往Kafka topic的数据量，以及避免发送潜在的tombst

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
比较函数和运算符 - 数据湖探索 DLI

false SELECT 3 < 2 OR 3 > 6; -- false IS NULL和IS NOT NULL 用于判断值是否为空，所有数据类型都可以用于此判断。 SELECT 3.0 IS NULL; -- false IS DISTINCT FROM和IS NOT DISTINCT

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符

总条数： 643

上一页
1
2
3
4
5
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

DML语法定义 - 数据湖探索 DLI

DML语法定义 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

condition - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

变更普通队列规格 - 数据湖探索 DLI

手动续费 - 数据湖探索 DLI

Doris结果表 - 数据湖探索 DLI

Doris维表 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

Flink作业性能调优类 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

比较函数和运算符 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线