搜索_华为云

Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Spark Jar作业开发指南 - 数据湖探索 DLI

Jar作业开发指南使用Spark Jar作业读取和查询OBS数据使用Spark作业访问DLI元数据使用Spark作业跨源访问数据源 Spark Jar 使用DEW获取访问凭证读写OBS 获取Spark作业委托临时凭证用于访问其他云服务

 帮助中心 > 数据湖探索 DLI > 开发指南
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

生成compaction计划（op指定为“schedule”），或者执行已经生成的compaction计划（op指定为“run”）是 table 需要查询表的表名，支持database.tablename格式 table，path须选填其中之一 path 需要查询表的路径 table，path须选填其中之一 timestamp

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
开启或关闭数据多版本 - 数据湖探索 DLI

开启或关闭数据多版本功能描述 DLI提供多版本功能，用于数据的备份与恢复。开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
Spark SQL常用配置项说明 - 数据湖探索 DLI

配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
预览SQL作业查询结果 - 数据湖探索 DLI

预览SQL作业查询结果功能介绍该API用于在执行SQL查询语句的作业完成后，查看该作业执行的结果。目前仅支持查看“QUERY”类型作业的执行结果。该API只能查看前1000条的结果记录，且不支持分页查询。若要查看全部的结果记录，需要先导出查询结果再进行查看，详细请参见导出查询结果。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

ARCHIVELOG 命令功能用于根据配置对Timeline上的Instant进行归档，并从Timeline上将已归档的Instant删除，以减少Timeline的操作压力。命令格式 RUN ARCHIVELOG ON tableIdentifier; RUN ARCHIVELOG

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
查询分组资源列表（废弃） - 数据湖探索 DLI

是否必选参数类型说明 kind 否 String 指定文件类型。包括以下文件类型： jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。 tags 否 String 指定标签过滤。请求消息无请求参数。响应消息

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
插入数据至DCS表 - 数据湖探索 DLI

DLI_TABLE 已创建跨源连接的DLI表名称。 DLI_TEST 为包含待查询数据的表。 field1,field2...，field 表“DLI_TEST”中的列值，需要匹配表“DLI_TABLE”的列值和类型。 where_condition 查询过滤条件。 num 对查询结果进行限制，num参数仅支持INT类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
Flink作业委托场景开发指导 - 数据湖探索 DLI

Flink作业委托场景开发指导 Flink Opensource SQL使用DEW管理访问凭据 Flink Jar 使用DEW获取访问凭证读写OBS 获取Flink作业委托临时凭证用于访问其他云服务父主题： Flink作业开发指南

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
BlackHole - 数据湖探索 DLI
BlackHole - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据语法格式

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
导出查询结果 - 数据湖探索 DLI

导出查询结果功能介绍该API用于将SQL语句的查询结果导出到OBS对象存储中，只支持导出“QUERY”类型作业的查询结果。该API为异步操作。目前只支持导出数据到OBS中，且导出的路径必须指定到文件夹级别。OBS路径中不支持逗号，且其中的桶名不能以正则格式“.[0-9]+(.*)”结尾，即，若桶名包含“

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
集合函数 - 数据湖探索 DLI
集合函数 - 数据湖探索 DLI

返回数组索引为integer的元素。索引从1开始 ELEMENT(array) 返回数组中的唯一元素。若数组为空，则返回null 若数组中元素个数大于1，则抛出异常 CARDINALITY(map) 返回map中键值对的条数 map ‘[’ key ‘]’ 返回map中key所对应的值父主题：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
欠费说明 - 数据湖探索 DLI
欠费说明 - 数据湖探索 DLI

生按需计费？识别产生按需计费的原因，并重新选择正确的套餐包或保证账户中的余额充足。未购买套餐包，在按需计费模式下账户的余额不足。欠费影响包年/包月对于包年/包月DLI资源。如队列或弹性资源池，用户已经预先支付了资源费用，因此在账户出现欠费的情况下，已有的包年/包月资源仍可

 帮助中心 > 数据湖探索 DLI > 计费说明
停止计费 - 数据湖探索 DLI
停止计费 - 数据湖探索 DLI

对于包年/包月计费模式的资源，例如包年/包月的弹性资源池、包年/包月的队列等，用户在购买时会一次性付费，服务将在到期后自动停止使用。如果在计费周期内不再使用包年/包月资源，您可以执行退订操作，系统将根据资源是否属于五天无理由退订、是否使用代金券和折扣券等条件返还一定金额到您的账户。详细的退订规则请参见云服务退订规则概览。

帮助中心 > 数据湖探索 DLI > 计费说明
已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

餐包资源的使用情况？如果套餐包额度已超出，产生按需计费为正常现象；如果套餐包额度未超出，请继续排查判断是否产生了套餐包未涵盖的计费项。判断是否产生了套餐包未涵盖的计费项 DLI的计费项分为计算资源计费、数据存储量计费、数据扫描量计费。如果购买的套餐包资源未覆盖使用的计费项，产生按需计费属于正常现象：

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消息进行过滤，则可以考虑先实时接入生成offset，再truncate

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
查看Flink作业详情 - 数据湖探索 DLI

时延指事件从源端算子到达本算子的过程中消耗的时间，单位为毫秒（ms）。发送的记录数算子发送数据的记录。发送的字节数算子发送的字节数。接受的字节数算子接收的字节数。接受的记录数算子收到数据的记录。开始时间算子运行开始时间。结束时间算子运行结束时间。查看Flink作业执行计划

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查询作业状态 - 数据湖探索 DLI

Insert作业执行过程中扫描到的错误记录数。 input_size Long 作业执行过程中扫描文件的大小，单位字节。 result_count Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name String 记录其操作的表所在的数据库名称。类

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API

总条数： 1028

上一页
1
...
23
24
25
...
52
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Debezium Format - 数据湖探索 DLI

Spark Jar作业开发指南 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

预览SQL作业查询结果 - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

插入数据至DCS表 - 数据湖探索 DLI

Flink作业委托场景开发指导 - 数据湖探索 DLI

BlackHole - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

集合函数 - 数据湖探索 DLI

欠费说明 - 数据湖探索 DLI

停止计费 - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线