搜索_华为云

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

表2 源端作业配置参数名参数值源连接名称选择1.a中已创建的数据源名称。 Topics 选择MRS Kafka待迁移的Topic名称，支持单个或多个Topic。当前示例为：kafkatopic。数据格式根据实际情况选择当前消息格式。本示例选择为：CDC（DRS_JSON），以DRS_JSON格式解析源数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
查询批处理作业列表 - 数据湖探索 DLI

批处理作业所属用户。 proxyUser 否 String 批处理作业所属代理用户（资源租户）。 kind 否 String 批处理作业类型，只支持spark类型参数。 queue 否 String 批处理作业所在队列。 image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
提交SQL作业（废弃） - 数据湖探索 DLI

SQL语句执行所在的数据库。当创建新数据库时，不需要提供此参数。 conf 否 Array of objects 用户定义适用于此作业的配置参数。目前支持的配置项： dli.sql.join.preferSortMergeJoin（是否优先使用SortMergeJoin） dli.sql.a

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
提交SQL作业（推荐） - 数据湖探索 DLI

字，且不能以下划线开头。 conf 否 Array of Strings 用户以“key/value”的形式设置用于此作业的配置参数。目前支持的配置项请参考表3。 tags 否 Array of Objects 作业的标签。具体请参考表4。 engine_type 否 String

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

延迟时间，每到达一个迟到数据，则更新窗口的输出结果注意事项若使用insert语句将结果写入sink中，则sink需要支持upsert模式，所以结果表需要支持upsert操作，且定义主键。延迟时间设置仅用于事件时间，在处理时间中不生效。辅助函数必须使用与 GROUP BY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

迟时间，每到达一个迟到数据，则更新窗口的输出结果注意事项如果使用insert语句将结果写入sink中，则sink需要支持upsert模式，所以结果表需要支持upsert操作，且定义主键。延迟时间设置仅用于事件时间，在处理时间中不生效。辅助函数必须使用与 GROUP BY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
查询作业状态 - 数据湖探索 DLI

user_conf String SQL查询的相关列信息的Json字符串。 result_format String 作业结果的存储格式，当前只支持csv。 result_path String 作业结果的OBS路径。表3 tags参数参数名称是否必选参数类型说明 key 是

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
查询作业详细信息 - 数据湖探索 DLI

已有文件。 data_path 是 String 导入或导出的文件路径。 data_type 是 String 导入或导出的数据类型（当前支持csv和json格式）。 database_name 是 String 导入或导出表所属的数据库名称。 table_name 是 String

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
获取分区信息列表（废弃） - 数据湖探索 DLI

Integer 每页显示的返回信息的个数，默认值为100。 offset 否 Integer 偏移量。 filter 否 String 筛选条件，目前只支持“=”条件筛选，例如：name=name1，表示筛选出分区中name=name1的数据，name为分区列名称，name1为分区列的值。key和value不区分大小写。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

Format 允许我们基于CSV schema 进行解析和生成CSV 数据。目前的CSV schema 是基于table schema 推导出来的。支持的Connector Kafka Upsert Kafka 参数说明表1 参数是否必选默认值类型说明 format 是 (none)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

SETS ((origin_state,origin_zip ),( origin_state ),()); Group by 子句目前不支持使用列的别名，例如： select count(userid) as num ,dept as aaa from salary group

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
查看弹性资源池的基本信息 - 数据湖探索 DLI

列显示规则。在列表页面上方的搜索区域，您可以名称和标签筛选需要的弹性资源池。单击展开弹性资源池基本信息卡片，查看弹性资源池详细信息。支持查看以下信息：弹性资源池名称、弹性资源池创建用户、创建时间、弹性资源池VPC网段、弹性资源池是否启用IPv6，如果开启IPv6将显示具体的子网的IPv6网段。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
get_json_object - 数据湖探索 DLI
get_json_object - 数据湖探索 DLI

$表示根节点。 .表示子节点。 []表示[number]表示数组下标，从0开始。 *表示Wildcard for []，返回整个数组。*不支持转义。返回值说明返回STRING类型的值。如果json为空或非法的json格式，返回NULL。如果json合法，path也存在，则返回对应字符串。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

更多介绍和使用请参考开源社区文档：窗口聚合。分组窗口的开始和结束时间戳可以通过 window_start 和 window_end 来选定。窗口表值函数 Flink 支持在 TUMBLE， HOP 和 CUMULATE 上进行窗口聚合。在流模式下，窗口表值函数的时间属性字段必须是事件时间或处理时间。关于窗口函数更多信息，参见

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
创建DLI表关联DWS - 数据湖探索 DLI

“partitionColumn”、“lowerBound”、“upperBound”、“numPartitions”四个参数必须同时设置，不支持仅设置其中某一个或某几个。为了提升并发读取的性能，建议使用自增列。 lowerBound partitionColumn设置的字段数据最小值，该值包含在返回结果中。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
数据赋权（用户）（废弃） - 数据湖探索 DLI

tables.tb2.columns.column1。 privileges 是 Array of Strings 待赋权，回收或更新的权限列表。具体支持的权限列表详细可以参考数据权限列表。示例值：["SELECT"]。说明：若“action”为“update”，更新列表为空，则表示回收用户在该数据库或表的所有权限。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
查询所有表（废弃） - 数据湖探索 DLI

create_time 是 Long 表创建时间。是单位为“毫秒”的时间戳。 data_type 否 String 所列OBS表数据的类型，目前支持：parquet、ORC、CSV、JSON、Avro格式。说明：只有OBS表有该参数。 data_location 是 String 数据存储位置，分为DLI和OBS。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
查询所有弹性资源池 - 数据湖探索 DLI

弹性资源池所属的队列信息。 manager 否 String 弹性资源池类型。 label 否 Map<string, string> 标识弹性资源池，目前只支持开发者标签，"label": {"billing_spec_code":"developer"}。 id 否 Long 弹性资源池ID。请求示例

 帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
Hudi表模型设计规范 - 数据湖探索 DLI

比，因此在实时入湖场景中需要选择MOR表模型。 Hudi表名以及列名采用小写字母。多引擎读写同一张Hudi表时，为了规避引擎之间大小写的支持不同，统一采用小写字母。建议 Spark批处理场景，对写入时延要求不高的场景，采用COW表。 COW表模型中，写入数据存在写放大问题，因

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
创建JDBC维表 - 数据湖探索 DLI
创建JDBC维表 - 数据湖探索 DLI

维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length value}{time unit label}，如123ms, 321s，支持的时间单位包括: d,h,min,s,ms等，默认为ms。 connector.lookup.max-retries 否维表配置，数据拉取最大重试次数，默认为3。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表

总条数： 651

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

查询批处理作业列表 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

查询作业详细信息 - 数据湖探索 DLI

获取分区信息列表（废弃） - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

get_json_object - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

数据赋权（用户）（废弃） - 数据湖探索 DLI

查询所有表（废弃） - 数据湖探索 DLI

查询所有弹性资源池 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

创建JDBC维表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线