搜索_华为云

使用Hive语法创建OBS表 - 数据湖探索 DLI

示例说明：创建名为table2的OBS非分区表，您可以根据业务需求自定义列字段的原生数据类型：与文字字符有关可以使用STRING、CHAR或者VARCHAR。与时间有关的可以使用TIMESTAMP、DATE。与整数有关的可以使用INT、SMALLINT/SHORT、BIGINT/LONG、TINYINT。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 创建OBS表
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

该SDK接口不支持sql_pattern，即通过指定sql片段作为作业过滤条件进行查询。如果需要则可以通过查询所有作业API接口指定该参数进行查询。查询SQL类型作业您可以使用该接口查询当前工程下的所有SQL类型作业的信息并获取查询结果。示例代码如下： def list_s

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
清理多版本数据 - 数据湖探索 DLI

数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时，多版本保留周期外的数据不会自动清理。可以通过本章节介绍的SQL命令手动进行多版本数据清理。语法格式清理多版本保留周期外数据。 clear history for table [db_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
OVER - 数据湖探索 DLI
OVER - 数据湖探索 DLI

关键字 PARTITION BY：可以用一个或多个键分区。和GROUP BY子句类似，PARTITION BY将表按分区键分区，每个分区是一个窗口，窗口函数作用于各个分区。单表分区数最多允许7000个。 ORDER BY：决定窗口函数求值的顺序。可以用一个或多个键排序。通过ASC或

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
pyspark样例代码 - 数据湖探索 DLI

建批处理作业》。创建Spark作业完成后，在控制台单击右上角“执行”提交作业，页面显示“批处理作业提交成功”说明Spark作业提交成功，可以在Spark作业管理页面查看提交的作业的状态和日志。创建Spark作业时选择的“所属队列”为创建跨源连接时所绑定的队列。如果选择spark版本为2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下：前提条件已参考Java SDK概述配置Java SDK环境。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
清理多版本数据 - 数据湖探索 DLI

数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时，多版本保留周期外的数据不会自动清理。可以通过本章节介绍的SQL命令手动进行多版本数据清理。语法格式清理多版本保留周期外数据。 clear history for table [db_name

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 多版本备份恢复数据
OVER子句 - 数据湖探索 DLI
OVER子句 - 数据湖探索 DLI

关键字 PARTITION BY：可以用一个或多个键分区。和GROUP BY子句类似，PARTITION BY将表按分区键分区，每个分区是一个窗口，窗口函数作用于各个分区。单表分区数最多允许7000个。 ORDER BY：决定窗口函数求值的顺序。可以用一个或多个键排序。通过ASC或

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

如果API调用超过该时间限制则会超时报错。解决方案调用“提交SQL作业”API时可以通过设置“dli.sql.sqlasync.enabled”参数为“true”来异步运行该作业。具体可以参考提交SQL作业API。父主题： DLI API类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
怎样管理在DLI上运行的作业 - 数据湖探索 DLI

怎样管理在DLI上运行的作业管理大量的DLI作业时您可以采用以下方案：作业分组：将几万个作业根据不同的类型分组，不同类型的作业通过不同的队列运行。创建IAM子用户或者创建IAM子用户，将不同类型的作业通过不同的用户执行。具体请参考《数据湖探索用户指南》。此外DLI还

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
开启或关闭数据多版本 - 数据湖探索 DLI

），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据。其他多版本SQL语法请参考多版本备份恢复数据。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表语法可以参考使用Hive语法创建OBS表。语法格式开启多版本功能

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 修改表
禁止或恢复表的生命周期 - 数据湖探索 DLI

禁止或恢复表的生命周期功能介绍禁止或恢复指定表或分区的生命周期。使用禁止或恢复表的生命周期有以下两种场景：表或分区表开启了生命周期的功能，该功能可以禁止或恢复表的生命周期，即修改“dli.table.lifecycle.status”的参数值。表或分区表未开启生命周期的功能，使用禁止或恢复表的生命周期，则会增加“dli

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 表生命周期管理
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

弹性资源池产品规格弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DLI提供以下规格的计算资源，如表1所示。

帮助中心 > 数据湖探索 DLI > 产品介绍
Upsert Kafka结果表 - 数据湖探索 DLI

适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
分配权限 - 数据湖探索 DLI
分配权限 - 数据湖探索 DLI

权限类型可参见数据权限列表。 resource可以是queue、database、table、view、column，格式分别为： queue的格式为：queues.queue_name queue支持的Privilege权限类型可以参考下表：操作说明 DROP_QUEUE 删除队列

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
开启或关闭数据多版本 - 数据湖探索 DLI

），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据。其他多版本SQL语法请参考多版本备份恢复数据。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表语法可以参考使用Hive语法创建OBS表。语法格式开启多版本功能

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
禁止或恢复表的生命周期 - 数据湖探索 DLI

禁止或恢复表的生命周期功能介绍禁止或恢复指定表或分区的生命周期。使用禁止或恢复表的生命周期有以下两种场景：表或分区表开启了生命周期的功能，该功能可以禁止或恢复表的生命周期，即修改“dli.table.lifecycle.status”的参数值。表或分区表未开启生命周期的功能，使用禁止或恢复表的生命周期，则会增加“dli

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

务功能。您可以按以下操作步骤进行查询：检查该OBS桶是否被设置为了DLI日志桶。在DLI管理控制台的“全局配置 > 作业配置” 页查看对应OBS桶是否被设置为了DLI日志桶，日志桶不能用于DLI的其他业务功能中。确认桶是否应用于其他业务功能。如果是，您可以在DLI管理控

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
删除表 - 数据湖探索 DLI
删除表 - 数据湖探索 DLI

成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。注意事项所要删除的表必须是当前数据库下存在的，否则会出错，可以通过添加IF EXISTS来避免出错。示例参考创建OBS表或者创建DLI表中的示例描述创建对应的表。在当前所在数据库下删除名为test的表。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
全外连接 - 数据湖探索 DLI
全外连接 - 数据湖探索 DLI

JOIN：根据左表与右表的所有记录进行匹配，没有匹配值的记录返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例利用全外连接可以将两张表中的所有记录返回，没有匹配值的左表及右表记录将返回NULL。 1 2 SELECT student_info.name, course_info

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 连接操作SELECT

总条数： 1182

上一页
1
...
50
51
52
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hive语法创建OBS表 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

OVER - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

OVER子句 - 数据湖探索 DLI

创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

怎样管理在DLI上运行的作业 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

分配权限 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

删除表 - 数据湖探索 DLI

全外连接 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线