搜索_华为云

JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
比较函数 - 数据湖探索 DLI
比较函数 - 数据湖探索 DLI

和分组操作中可以被重写的操作。对于流式查询，该操作在 join 和分组操作中被重写。根据输入行的数量计算查询结果所需的状态可能会无限增长。请提供具有有效保留间隔的查询配置，以防止状态过大。 value IN (sub-query) BOOLEAN 如果 value 等于子查询结果集中的一行则返回 TRUE。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
服务韧性 - 数据湖探索 DLI
服务韧性 - 数据湖探索 DLI

障数据的持久性和可靠性。流量限制：DLI通过设置流量控制机制，防止服务过载并保持服务的稳定性。跨AZ容灾：DLI云服务采用跨可用区容灾部署，减少单点故障的风险，提高系统的可用性和弹性。备份恢复：DLI自动化的备份策略和恢复计划，确保在发生故障时可以迅速恢复服务和数据。父主题：

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

创建数据库功能描述创建数据库。语法格式 1 2 3 CREATE [DATABASE | SCHEMA] [IF NOT EXISTS] db_name [COMMENT db_comment] [WITH DBPROPERTIES (property_name=property_value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
使用JDBC提交SQL作业 - 数据湖探索 DLI

使用JDBC提交SQL作业本文介绍通过JDBC连接DLI并提交SQL作业。下载并安装JDBC驱动包使用JDBC连接DLI并提交SQL作业 DLI JDBC Driver支持的API列表父主题：使用客户端工具连接DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出DLI表数据至OBS中支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

NAME primary-keys ARRAY<STRING> NULL 保存源表的主键的列名的数组。如果includePrimaryKeys配置属性设置为true，则仅在JSON输出中包含primary-keys字段。 ingestion-timestamp TIMESTAMP_LTZ(6)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

DLI Hudi元数据 DLI Hudi元数据说明创建Hudi表时会在元数据仓创建表的相关元数据信息。 Hudi支持对接DLI元数据和Lakeformation元数据（仅Spark 3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

db/{table_name}，其中{lakeformation_catalog_url}对接的lakeformation catalog配置的location，{schema_name}为建表时使用的schema，{table_name}为表名。不允许向托管表（表属性external

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
DLI Delta元数据 - 数据湖探索 DLI

DLI Delta元数据在DLI中提交Spark SQL作业开发Delta的SQL语法请参考Delta SQL语法参考。在DLI中提交Spark Jar作业开发Delta请参考在DLI使用Delta提交Spark Jar作业。 DLI Delta元数据说明创建Delta表时会在元数据仓创建表的相关元数据信息。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

口的周期触发策略；当lateness_interval为0时，表示没有使用窗口结束后的延迟策略；当二者都没有填写时，默认两种策略都没有配置，仅使用普通的TUMBLE窗口。若仅需使用延迟时间策略，则需要将上述period_interval格式中的'10'设置为 '0'。 OVER

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

https://{Endpoint}/v3/projects”，其中{Endpoint}为IAM的终端节点，可以从地区和终端节点获取。响应示例如下，例如DLI服务部署的区域为“cn-north-4”，相应消息体中查找“name”为“cn-north-4”，其中projects下的“id”即为项目ID。 {

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

计费概述数据湖探索DLI的计费由不同的计费项组成，不同的计费项有不同的计费模式，如图1所示。图1 DLI的计费组成计费项 DLI的计费项包括计算计费、存储计费、扫描量计费。DLI的计费详情请参见DLI产品价格详情。您可以通过DLI提供的价格计算器，快速计算出购买资源的参考价格。

帮助中心 > 数据湖探索 DLI > 计费说明
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

thon程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DL

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询作业列表 - 数据湖探索 DLI

shared_cluster：共享 exclusive_cluster：独享 edge_node：边缘节点 job_config 否 Object 作业配置。 “show_detail”为“false”时独有。具体参数说明请参见表6。 main_class 否 String jar包主类。“s

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查询作业详情 - 数据湖探索 DLI

shared_cluster：共享 exclusive_cluster：独享 edge_node：边缘节点 job_config 否 Object 作业配置, 具体参数说明请参见表4。 main_class 否 String jar包主类。例如，org.apache.spark.examples

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 TPC-H样例数据简介 TPC-H（商业智能计算测试）是交易处理效能委员会（TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集。目前，在学术

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板

总条数： 587

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

比较函数 - 数据湖探索 DLI

服务韧性 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

使用JDBC提交SQL作业 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

DLI Delta元数据 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线