搜索_华为云

使用Hive语法创建OBS表 - 数据湖探索 DLI

依据的OBS分区表。在TBLPROPERTIES中配置dli.multi.version.enable、comment、orc.compress和auto.purge。 dli.multi.version.enable：本例配置为true，即代表开启DLI数据多版本功能，用于表数据的备份与恢复。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
导出数据（废弃） - 数据湖探索 DLI

参数类型说明 data_path 是 String 导出数据的储存路径（当前仅支持将数据存储在OBS上）。另外，“export_mode”配置为“errorifexists”时，该路径下的文件夹须不存在，如请求样例中的“test”文件夹。 data_type 是 String 导

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
创建增强型跨源连接 - 数据湖探索 DLI

系统提示信息，执行成功时，信息可能为空。 connection_id String 连接ID，用于标识跨源连接的UUID。请求示例为队列创建增强型跨源连接，并配置主机信息。 { "name": "test", "dest_vpc_id": "22094d8f-c310-4621-913d-4c4d655d8495"

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
数据湖探索简介 - 数据湖探索 DLI

扩容。添加到同一个弹性资源池的多个队列，CU资源可以共享，达到资源的合理利用。配置跨源时，必须为每个队列分配不重合的网段，占用大量VPC网段。多队列通过弹性资源池统一进行网段划分，减少跨源配置的复杂度。资源调配多个队列同时扩容时不能设置优先级，在资源不够时，会导致部分队列扩容申请失败。

帮助中心 > 数据湖探索 DLI > 产品介绍
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

schema-include 否 false Boolean 设置 Debezium Kafka Connect 时，用户可以启用 Kafka 配置 'value.converter.schemas.enable' 以在消息中包含 schema。此选项表明 Debezium JSON 消息是否包含

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

量和分组持续的时间，持续时间较短的 group 窗口不会产生状态过大的问题。可以提供一个合适的状态 time-to-live (TTL) 配置来防止状态过大。注意：这可能会影响查询结果的正确性。更多介绍和使用请参考开源社区文档：分组聚合。 DISTINCT 聚合 DISTINCT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

复杂类型 ARRAY 数组。示例：ARRAY[1, 2, 3]。 --创建ARRAY类型表 create table array_tb(col1 ARRAY<STRING>); --插入一条ARRAY类型数据 insert into array_tb values(ARRAY['HetuEngine'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

以SQL作业为例：单击“作业管理 > SQL作业”。在作业管理控制台页面筛选使用default队列的作业。单击展开作业详情，查看作业扫描量。图1 配置费用示例计费示例价格仅供参考，实际计算请以数据湖探索价格详情中的价格为准。参考数据湖价格详情页的按数据扫描量计算计费样例。欠费影响

 帮助中心 > 数据湖探索 DLI > 计费说明
MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

dli:table:insertIntoTable, dli:table:delete。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例部分字段更新 create table h0(id int, comb int, name string

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

datasource.css。如果选择Spark版本为3.1.1时，无需选择Module模块，需在 “Spark参数（--conf)” 配置 spark.driver.extraClassPath=/usr/share/extension/dli/spark-jar/datasource/css/*

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
SparkSQL建表参数规范 - 数据湖探索 DLI

SparkSQL建表参数规范规则建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

https://{Endpoint}/v3/projects”，其中{Endpoint}为IAM的终端节点，可以从地区和终端节点获取。响应示例如下，例如DLI服务部署的区域为“cn-north-4”，相应消息体中查找“name”为“cn-north-4”，其中projects下的“id”即为项目ID。 {

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

聚合函数聚合函数对一组值进行运算，最终获得一个单值。除count()、count_if()、max_by()、min_by()和approx_distinct()外，其它聚合函数都忽略空值，并在没有输入行或所有值都为空时返回空值。例如sum()返回null而不是零，并且avg

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
比较函数 - 数据湖探索 DLI
比较函数 - 数据湖探索 DLI

和分组操作中可以被重写的操作。对于流式查询，该操作在 join 和分组操作中被重写。根据输入行的数量计算查询结果所需的状态可能会无限增长。请提供具有有效保留间隔的查询配置，以防止状态过大。 value IN (sub-query) BOOLEAN 如果 value 等于子查询结果集中的一行则返回 TRUE。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

DLI委托可以确保DLI在跨源分析场景中安全、有效地访问其他云服务。发布区域：全部创建DLI自定义委托 OBS 2.0支持自定义镜像 DLI支持容器部署的集群。在容器集群中，Spark作业和Flink作业相关组件都运行在容器中，通过下载DLI提供的自定义镜像，可以改变Spark作业和Fli

帮助中心 > 数据湖探索 DLI > 功能总览
创建表（废弃） - 数据湖探索 DLI

OBS表必选参数。 data_path 否 String 新增OBS表数据的存储路径，必须是OBS的路径。说明： OBS表必选参数。 data_path配置的OBS桶路径不建议为根目录，否则清空表数据的时候，就会把根目录内的数据全部清除，导致数据丢失。 with_column_header 否

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 TPC-H样例数据简介 TPC-H（商业智能计算测试）是交易处理效能委员会（TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集。目前，在学术

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板

总条数： 523

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hive语法创建OBS表 - 数据湖探索 DLI

导出数据（废弃） - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

MERGE INTO - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

比较函数 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线