搜索_华为云

UPDATE - 数据湖探索 DLI
UPDATE - 数据湖探索 DLI

1; update h0 set price = price *2, name = 'a2' where id = 2; 系统响应可以确认任务状态成功，运行QUERY语句查看表中数据已被更新。父主题： Hudi DML语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
DLI作业开发流程 - 数据湖探索 DLI

的数据分析场景。 Spark作业可通过交互式会话（session）和批处理（batch）方式提交计算任务。通过在DLI提供的弹性资源池队列上提交作业，简化了资源管理和作业调度。支持多种数据源和格式，提供了丰富的数据处理能力，包括但不限于SQL查询、机器学习等。详细操作请参考创建Spark作业。

帮助中心 > 数据湖探索 DLI > 用户指南
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

通过SQL建表就可以完成数据源的映射。简单易用：直接使用标准SQL编写指标分析逻辑，无需关注背后复杂的分布式计算平台。按需计费：日志分析按时效性要求按周期进行调度，每次调度之间存在大量空闲期。DLI按需计费只在使用期间收费，有效节约队列成本。资源和成本规划表1 资源和成本规划

 帮助中心 > 数据湖探索 DLI > 最佳实践
使用CDM迁移数据至DLI - 数据湖探索 DLI

使用CDM迁移数据至DLI CDM提供了可视化的迁移任务配置页面，支持多种数据源到数据湖的迁移能力。本节操作介绍使用CDM迁移工具将数据从数据源迁移至DLI的操作步骤。图1 使用CDM迁移数据至DLI操作流程步骤1：创建CDM集群 CDM集群用于执行数据迁移作业，将数据从数据源迁移至DLI。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Hudi数据表Clean规范 - 数据湖探索 DLI

Clean操作并不是每次写数据时都会触发，至少需要满足两个条件： Hudi表中需要有旧版本的文件。对于COW表来说，只要保证数据被更新过就一定存在旧版本的文件。对于MOR表来说，要保证数据被更新过并且做过Compaction才能有旧版本的文件。 Hudi表满足hoodie.cleaner.commits

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

云下：HDFS。生态兼容 DLV、永洪BI、帆软。大数据生态工具。自定义镜像支持，满足业务多样性。无。工作流调度 DataArts Studio-DLF调度。自建大数据生态的调度工具，如Airflow。企业级多租户基于表的权限管理，可以精细化到列权限。基于文件的权限管理。高性能

 帮助中心 > 数据湖探索 DLI > 产品介绍
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

timestamp进行过滤，如果没有指定end.timestamp，则只需要根据start.timestamp进行过滤。提交其他SQL时，需要清除上述配置参数，避免影响其他任务执行结果。父主题： Spark on Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
删除队列 - 数据湖探索 DLI
删除队列 - 数据湖探索 DLI

删除队列功能介绍该API用于删除指定队列。若指定队列正在执行任务，则不允许删除。调试您可以在API Explorer中调试该接口。 URI URI格式： DELETE /v1.0/{project_id}/queues/{queue_name} 参数说明表1 URI参数

 帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
DLI内置依赖包 - 数据湖探索 DLI

DLI内置依赖包 DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。 Spark 3.1.1 依赖包表1 Spark 3.1.1 依赖包依赖包名称 accessors-smart-1

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

主要用于代码调试，查看输出结果。前提条件无。注意事项 Print结果表支持以下四种格式内容输出：打印内容条件1 条件2 标识符:任务 ID> 输出数据需要提供前缀打印标识符，即创建Print表时在with参数中指定print-identifier。 parallelism

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

主要用于代码调试，查看输出结果。前提条件无。注意事项 Print结果表支持以下四种格式内容输出：打印内容条件1 条件2 标识符:任务 ID> 输出数据需要提供前缀打印标识符，即创建Print表时在with参数中指定print-identifier。 parallelism

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
配置SQL防御规则 - 数据湖探索 DLI

的问题，例如SQL输入语句质量良莠不齐、SQL问题难定位、大SQL语句消耗资源过多等。低质量的SQL会对数据分析平台系统带来不可预料的冲击，影响系统的性能或者平台稳定性。 DLI在Spark SQL引擎中增加SQL防御能力，基于用户可理解的SQL防御策略，实现对典型大SQL、低

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查看Flink作业详情 - 数据湖探索 DLI

单击需要查看的作业名称，进入“作业详情”页面。在“任务列表”页签，可以查看任务的节点信息。图2 任务列表查看算子任务列表，具体参见下表：表5 算子任务列表参数参数说明名称算子名称。持续时间算子运行的持续时间。最大并行数算子中并行的Task的个数。任务算子的任务有以下几种：红色数字表示已失败的Task个数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink作业性能调优类 - 数据湖探索 DLI

Flink作业性能调优类 Flink作业推荐配置指导 Flink作业性能调优 Flink作业重启后，如何保证不丢失数据？ Flink作业运行异常，如何定位 Flink作业重启后，如何判断是否可以从checkpoint恢复 DLI Flink作业提交运行后（已选择保存作业日志到OB

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
Postgres CDC源表 - 数据湖探索 DLI

CDC源表功能描述 Postgres的CDC源表，即Postgres的流式源表，用于依次读取PostgreSQL数据库全量快照数据和变更数据，保证不多读一条也不少读一条数据。即使发生故障，也能采用Exactly Once方式处理。前提条件 PostgreSQL CDC要求Postgre版本为9

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

Flink有什么区别？ DLI Flink是天然的云原生基础架构。在内核引擎上DLI Flink进行了多处核心功能的优化，并且提供了企业级的一站式开发平台，自带开发和运维功能，免除自建集群运维的麻烦；在connector方面除了支持开源connector之外，还可以对接云上Mysql、GaussDB、MRS

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复什么是从checkpoint恢复？ Flink Checkpoint 是一种容错恢复机制。这种机制保证了实时程序运行时，遇到异常或者机器问题时能够进行自我恢复。从checkpoint恢复的原则通常当作业执行失败、资源异常重启等非人为触发

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建弹性资源池并添加队列 - 数据湖探索 DLI

弹性资源池CU的变化，部分情况下系统无法保证按计划扩容/缩容至目标CUs：弹性资源池扩容时，可能会由于物理资源不足导致弹性资源池无法扩容到设定的目标大小。弹性资源池缩容时，系统不保证将队列资源完全缩容到设定的目标大小。在执行缩容任务时，系统会先检查资源使用情况，判断是否存在

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

主键缓存到内存中，保证目标表的数据唯一，因此需要配置该值，否则会导致数据重复，默认值：true。 write.index_bootstrap.tasks 否环境默认并行度 Integer “index.bootstrap.enabled”开启后有效，增加任务数提升启动速度，默认值为环境默认并行度。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的这种模式减轻了运维负担，可以更专注于数据处理和分析任务本身。具体请参考《数据湖探索用户指南》。 MRS服务Spark组件的是建立在客户的购买MRS服务所分配的虚机上，用户可以根据实际需求调整

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类

总条数： 218

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

UPDATE - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

删除队列 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

Print - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

Flink作业性能调优类 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线