搜索_华为云

Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

参数说明参数是否必选默认值类型描述 format 是无 String 指定要使用的格式，这里应该是 'orc'。 Orc 格式也支持来源于 Table properties 的表属性。举个例子，您可以设置 orc.compress=SNAPPY 来允许spappy压缩。数据类型映射

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建表时指定表的生命周期 - 数据湖探索 DLI

非分区表如果表是非分区表，根据每张表的最后修改时间，经过生命周期时间后判断是否要回收此表。分区表如果是分区表，则根据各分区的最后一次表数据被修改的时间（LAST_ACCESS_TIME）判断该分区是否该被回收。分区表的最后一个分区被回收后，该表不会被删除。分区表不支持设置

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
修改队列网段（废弃） - 数据湖探索 DLI

252.0/21 响应消息表3 响应参数参数名称是否必选参数类型说明 is_success 否 Boolean 请求执行是否成功。“true”表示请求执行成功。 message 否 String 系统提示信息，执行成功时，信息可能为空。请求示例修改队列的网段为172

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误问题现象在DataArts Studio上运行DLI SQL脚本，执行结果的运行日志显示语句执行失败，错误信息为： DLI.0999:

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 DLI Flink作业提交或运行失败时，对应生成的作业日志保存方式，包含以下三种情况：提交失败，只会在submit-client下生成提交日志。运行失败且在1

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
删除队列 - 数据湖探索 DLI
删除队列 - 数据湖探索 DLI

删除队列根据实际使用情况，您可以通过删除操作释放队列。如果待删除的队列中有正在提交或正在运行的作业，将不支持删除操作。删除队列不会导致您数据库中的表数据丢失。删除队列步骤在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择待删除的队列，单击“操作”列的“删除”删除。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

userData/kafka-sink.conf / path = /opt/data1/hadoop/tmp/usercache/omm/appcache/application_xxx_0015/container_xxx_0015_01_000002/userData/client.truststore

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
怎样管理在DLI上运行的作业 - 数据湖探索 DLI

怎样管理在DLI上运行的作业管理大量的DLI作业时您可以采用以下方案：作业分组：将几万个作业根据不同的类型分组，不同类型的作业通过不同的队列运行。创建IAM子用户或者创建IAM子用户，将不同类型的作业通过不同的用户执行。具体请参考《数据湖探索用户指南》。此外DLI还

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境自定义镜像应用场景通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
创建Flink Jar作业 - 数据湖探索 DLI

管理单元 * 4。 Spark资源并行度由Executor数量和Executor CPU核数共同决定。管理单元设置管理单元的CU数。并行数作业的并行数是指作业中各个算子的并行执行的子任务的数量，即算子子任务数就是其对应算子的并行度。说明：并行数不能大于计算单元（CU数量-管理单元CU数量）的4倍。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

SQL作业执行完成后，修改表名导致datasize不正确怎么办？在执行SQL作业后立即修改表名，可能会导致表的数据大小结果不正确。这是因为DLI在执行SQL作业时，会对表进行元数据更新，如果在作业执行完成前修改了表名，会和作业的元数据更新过程冲突，从而影响对数据大小的判断。为了

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI是否支持导入其他租户共享OBS桶的数据？ - 数据湖探索 DLI

DLI是否支持导入其他租户共享OBS桶的数据？ DLI支持将同一个租户下子账户共享OBS桶中的数据导入，但是租户级别共享OBS桶中的数据无法导入。 DLI不支持导入其他租户共享的OBS桶中的数据，主要是为了确保数据的安全性和数据隔离。对于需要跨租户共享和分析数据的场景，建议先将

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
isdate - 数据湖探索 DLI
isdate - 数据湖探索 DLI

isdate函数用于判断一个日期字符串能否根据指定的格式转换为一个日期值。命令格式 isdate(string date , string format) 参数说明表1 参数说明参数是否必选参数类型说明 date 是 DATE 或 STRING 代表需要判断的字符串。如果

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？不存在。 DLI没有启动spark.acls.enable配置项，所以不涉及Apache Spark 命令注入漏洞（CVE-2022-33891）。该漏洞主要影响在启用了ACL（访问控制列表

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

作会增加executor的内存消耗，如果executor内存不够时，导致作业运行失败。解决措施排查执行的SQL中是否有使用“/*+ BROADCAST(u) */”强制做broadcastjoin。如果有，则需要去掉该标识。设置spark.sql.autoBroadcast

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

from (values ('apple',7),('apple',8),('apple',8),('lemon',5) ) as t(key,value); - {apple=[7, 8, 8], lemon=[5]} 近似值聚合函数在实际情况下，对大量数据进行统计时，有时只关心一个

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

“立即启动”开始执行作业。等待作业运行完成，作业状态显示为“已完成”。登录RDS控制台，单击RDS数据库实例，单击创建的数据库名，如“test2”，在创建的表“tabletest2”所在行的“操作”列，单击“SQL查询”。在“SQL查询”界面，单击“执行SQL”，查看RDS表数据已写入成功。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
RENAME COLUMN - 数据湖探索 DLI
RENAME COLUMN - 数据湖探索 DLI

如果您的表已经在所需的协议版本上，需要先执行如下语句才能修改成功： ALTER TABLE table_name SET TBLPROPERTIES ('delta.columnMapping.mode' = 'name')；如果您的表不在所需的协议版本上，需要先执行如下语句才能修改成功： ALTER

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Schema演进语法说明
按需计费的弹性资源池，如果没提交作业运行就不计费？ - 数据湖探索 DLI

按需计费的弹性资源池，如果没提交作业运行就不计费？按需计费的弹性资源池默认勾选专属资源模式，自创建起按自然小时收费。无作业运行仍正常收费。按实际CU进行计费，秒级计费，按小时结算。按需弹性资源池创建成功一小时后方可删除。父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题

总条数： 817

上一页
1
2
3
4
5
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Orc Format - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

修改队列网段（废弃） - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

删除队列 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

怎样管理在DLI上运行的作业 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

DLI是否支持导入其他租户共享OBS桶的数据？ - 数据湖探索 DLI

isdate - 数据湖探索 DLI

DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

RENAME COLUMN - 数据湖探索 DLI

按需计费的弹性资源池，如果没提交作业运行就不计费？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线