搜索_华为云

Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Debezium Format 功能描述 Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

Canal Format 功能描述 Canal是一个 CDC（ChangeLog Data Capture，变更日志数据捕获）工具，可以实时地将 MySQL 变更传输到其他系统。Canal 为变更日志提供了统一的数据格式，并支持使用 JSON 或 protobuf序列化消息（Canal

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
DLI作业开发流程 - 数据湖探索 DLI

资源管理和作业调度。支持多种数据源和格式，提供了丰富的数据处理能力，包括但不限于SQL查询、机器学习等。详细操作请参考创建Spark作业。适用于大规模数据处理和分析，如机器学习训练、日志分析、大规模数据挖掘等场景。管理Jar作业的程序包 DLI允许用户提交编译为Jar包的F

帮助中心 > 数据湖探索 DLI > 用户指南
使用CDM迁移数据至DLI - 数据湖探索 DLI

使用CDM迁移数据至DLI CDM提供了可视化的迁移任务配置页面，支持多种数据源到数据湖的迁移能力。本节操作介绍使用CDM迁移工具将数据从数据源迁移至DLI的操作步骤。图1 使用CDM迁移数据至DLI操作流程步骤1：创建CDM集群 CDM集群用于执行数据迁移作业，将数据从数据源迁移至DLI。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Hudi数据表Compaction规范 - 数据湖探索 DLI

quet文件，大幅提升读取性能。规则有数据持续写入的表，24小时内至少执行一次compaction。对于MOR表，不管是流式写入还是批量写入，需要保证每天至少完成1次Compaction操作。如果长时间不做compaction，Hudi表的log将会越来越大，这必将会出现以下问题：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Flink作业相关API - 数据湖探索 DLI

Flink作业相关API 新建SQL作业更新SQL作业新建Flink Jar作业更新Flink Jar作业批量运行作业查询作业列表查询作业详情查询作业执行计划批量停止作业删除作业批量删除作业导出Flink作业导入Flink作业生成Flink SQL作业的静态流图

 帮助中心 > 数据湖探索 DLI > API参考
迁移数据场景概述 - 数据湖探索 DLI

迁移数据场景概述为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
数据迁移与传输方式概述 - 数据湖探索 DLI

导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
使用DLI分析电商BI报表 - 数据湖探索 DLI

Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录两种登录方式。登录步骤请参考《对象存储服务工具指南》。通过OBS Browser+上传数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI Python SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下。完整样例代码和依赖包说明请参考：Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

DLI SDK简介 DLI SDK简介数据湖探索服务软件开发工具包（DLI SDK，Data Lake Insight Software Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI

帮助中心 > 数据湖探索 DLI > SDK参考
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark Jar作业读取和查询OBS数据。配置S

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下：前提条件已参考Java SDK概述配置Java SDK环境。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
创建并提交Flink作业 - 数据湖探索 DLI

"status_desc": "" } } 批量运行作业。接口相关信息 URI格式：POST /v1.0/{project_id}/streaming/jobs/run {project_id}信息请从获取项目ID获取。请求参数说明详情，请参见批量运行作业。请求示例描述：在项目I

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

包括OBS授权给DLI服务、新建SQL作业、更新SQL作业、新建Flink自定义作业、更新Flink自定义作业、批量运行作业、查询作业列表、查询作业详情、查询作业执行计划、查询作业监控信息、批量停止作业、删除作业、批量删除作业、导出Flink作业、导入Flink作业、生成Flink SQL作业的静态流图、

帮助中心 > 数据湖探索 DLI > API参考
创建Bucket索引表调优 - 数据湖探索 DLI

事实表通常整表数据规模较大，以新增数据为主，更新数据占比小，且更新数据大多落在近一段时间范围内（年或月或天），下游读取该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小，以更新数据为

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

</dependency> 注意事项暂不支持通过python写UDF、UDTF、UDAF自定义函数。如果使用IntelliJ IDEA工具对创建的自定义函数进行调试，则需要在IDEA上勾选：include dependencies with "Provided" scope，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
CSS安全集群配置 - 数据湖探索 DLI

单击“安全模式”中的“下载证书”下载安全证书。使用keytool工具生成keystore和truststore文件。使用keytool工具生成keystore和truststore文件，其中需要使用到安全集群的安全证书（CloudSearchService.cer），keytool工具还有其他参数，可根据需求设置。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

达到PB级。数据种类多，有结构化的遥感影像栅格数据、矢量数据，非结构化的空间位置数据、三维建模数据；在大体量的地理大数据中，通过高效的挖掘工具或者挖掘方法实现价值提炼，是用户非常关注的话题。优势提供地理专业算子：支持全栈Spark能力，具备丰富的Spark空间数据分析算法算子

 帮助中心 > 数据湖探索 DLI > 产品介绍
资源标签相关API - 数据湖探索 DLI

资源标签相关API 批量添加资源标签批量删除资源标签查询资源实例数量查询资源实例列表查询指定资源类型的标签信息查询指定资源实例的标签信息

 帮助中心 > 数据湖探索 DLI > API参考

总条数： 118

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Debezium Format - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Flink作业相关API - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

资源标签相关API - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线