搜索_华为云

在DLI控制台管理表资源 - 数据湖探索 DLI

在DLI控制台管理表资源在DLI控制台配置表权限在DLI控制台删除表在DLI控制台修改表所有者将OBS数据导入至DLI 导出DLI表数据至OBS中在DLI控制台预览表数据父主题：创建数据库和表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（ ASC ）排列指只保留第一行，而降序排列（ DESC ）则只保留最后一行。 WHERE rownum

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
查询所有表（废弃） - 数据湖探索 DLI

表的信息。具体参数请参见表3。表3 tables参数参数是否必选参数类型说明 create_time 是 Long 表创建时间。是单位为“毫秒”的时间戳。 data_type 否 String 所列OBS表数据的类型，目前支持：parquet、ORC、CSV、JSON格式。只

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 表相关API（废弃）
分组资源相关API（废弃） - 数据湖探索 DLI

上传jar类型分组资源（废弃）上传pyfile类型分组资源（废弃）上传file类型分组资源（废弃）查询组内资源包（废弃）删除组内资源包（废弃）修改组或资源包拥有者（废弃）父主题：历史API

帮助中心 > 数据湖探索 DLI > API参考 > 历史API
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

table查看TBLPROPERTIES下的"verison"字段的值 "v1"为V1表；"v2"则为V2表。如需修改V1表为V2表请提交工单联系客户支持获取操作帮助。升级示例升级Spark引擎和修改数据表时，如新建队列时切换了计算资源类型可能会导致计费资源的费用变化。如果原队列使用的是弹性资

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
获取指定集群信息（废弃） - 数据湖探索 DLI

响应参数响应参数如表2所示。表2 响应参数说明参数是否必选参数类型说明 create_time 是 Long 创建集群的时间。是单位为“毫秒”的时间戳。 description 否 String 集群的描述信息。 cu_count 是 Integer 与集群绑定的计算单元个数。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

单引号（''）包围起来。 partition_specs 分区信息，key=value形式，key为分区字段，value为分区值。若分区字段为多个字段，可以不包含所有的字段，会删除匹配上的所有分区。“partition_specs”中的参数默认带有“( )”，例如：PARTITION

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

此处可以看到作业的执行状态。点击对应作业右侧的更多，可以在下拉菜单中跳转日志选单：归档日志：跳转OBS界面，可以看到该作业的全部日志归档地址，包含提交日志，Driver日志和Executor日志，在此处可以下载日志。提交日志：跳转到提交日志的聚合展示界面，可以查看任务提交中的日志信息。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
查询Delta表历史版本数据 - 数据湖探索 DLI

table_name Database中的表名，由字母、数字和下划线（_）组成。 timestamp_expression 时间戳，不能晚于当前时间，格式'yyyy-MM-ddTHH:mm:ss.SSS' version_code 1.3.1中查询结果中的版本号示例 SELECT

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
创建Bucket索引表调优 - 数据湖探索 DLI

事实表通常整表数据规模较大，以新增数据为主，更新数据占比小，且更新数据大多落在近一段时间范围内（年或月或天），下游读取该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小，以更新

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
使用Hive语法创建DLI表 - 数据湖探索 DLI

示例说明：创建名为table2的DLI非分区表，您可以根据业务需求自定义列子段的原生数据类型：与文字字符有关可以使用STRING、CHAR或者VARCHAR。与时间有关的可以使用TIMESTAMP、DATE。与整数有关的可以使用INT、SMALLINT/SHORT、BIGINT/LONG、TINYINT。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
还原Delta表到早期状态 - 数据湖探索 DLI

Database中的表名，由字母、数字和下划线（_）组成。 obs_path Obs路径，表示Delta表的存储位置。 timestamp_expression 时间戳，不能晚于当前时间，格式'yyyy-MM-ddTHH:mm:ss.SSS' version_code 1.3.1中查询结果中的版本号示例 RESTORE

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Spark作业场景描述本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
创建并提交Flink作业 - 数据湖探索 DLI

创建并提交Flink作业场景描述本章节指导用户通过API创建并运行Flink自定义作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Flink自定义作业所需的资源包。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

PI方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
DLI弹性资源池与队列简介 - 数据湖探索 DLI

8点到12点业务比较空闲，资源有剩余，部门B在这个时间段业务请求量大，原有资源规格满足不了，需要扩容时，请求不了部门A的队列资源，造成资源浪费。图3 资源隔离造成的资源浪费弹性资源池通过“分时按需弹性”功能，支持按照不同时间段对资源进行动态的扩缩容，保证资源的利用率和应对资源洪峰等诉求。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

table，path须选填其中之一 timestamp 在op指定为“run”时，可以指定timestamp来执行该时间戳对应的compaction计划以及该时间戳之前未执行的compaction计划否示例 call run_compaction(table => 'hudi_table1'

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Flink SQL作业类 - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ Flink Opensource SQL Elasticsearch结果表failure-handler参数

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
配置Hudi数据列默认值 - 数据湖探索 DLI

列的默认值设置要与列的类型一致，如不一致会进行类型强转，导致默认值精度丢失或者默认值为NULL。历史数据的默认值与列第一次设置的默认值一致，多次修改列的默认值不会影响历史数据的查询结果。设置默认值后rollback不能回滚默认值配置。 Spark SQL暂不支持查看列默认值信息，可以通过执行show

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
DLI产品咨询类 - 数据湖探索 DLI

怎样获取DLI作业样例（Demo） DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？怎样管理在DLI上运行的作业怎样修改DLI上已经创建好的表的字段名称？

帮助中心 > 数据湖探索 DLI > 常见问题

总条数： 610

上一页
1
...
25
26
27
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在DLI控制台管理表资源 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

查询所有表（废弃） - 数据湖探索 DLI

分组资源相关API（废弃） - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

获取指定集群信息（废弃） - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

查询Delta表历史版本数据 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

还原Delta表到早期状态 - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

Flink SQL作业类 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

DLI产品咨询类 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线