搜索_华为云

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移MRS Kafka数据至DLI。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI队列时队列类型需要选择为“SQL队列”。已创建包含Kafka组件的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
查询SQL作业日志 - 数据湖探索 DLI

在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。在“工程配置”页面，选择“DLI作业桶”，单击配置桶信息。图1 工程配置单击打开桶列表。选择用于存放DLI作业临时数据的桶，并单击“确定”。完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。图2

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移MRS Hive数据至DLI。其他MRS Hadoop组件数据，均可以通过CDM与DLI进行双向同步。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
查询Spark作业日志 - 数据湖探索 DLI

在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。在“工程配置”页面，选择“DLI作业桶”，单击配置桶信息。图1 工程配置单击打开桶列表。选择用于存放DLI作业临时数据的桶，并单击“确定”。完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。图2

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据操作场景 DLI Flink作业支持使用其他服务作为数据源和数据输出通道进行数据实时计算操作。本例采用Kafka服务作为数据源通道，以RDS作为数据输出通道，介绍创建并提交Flink OpenSource

帮助中心 > 数据湖探索 DLI > 快速入门
查询增强型跨源连接 - 数据湖探索 DLI

查询增强型跨源连接功能介绍该API用于查询该用户指定的已创建的增强型跨源连接。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v2.0/{project_id}/datasource/enhanced-connections/{connection_id}

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
创建经典型跨源连接 - 数据湖探索 DLI

创建经典型跨源连接功能介绍该API用于创建与其他服务的经典型跨源连接。推荐使用创建增强型跨源连接。系统default队列不支持创建跨源连接。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v2.0/{p

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
查询增强型跨源连接列表 - 数据湖探索 DLI

查询增强型跨源连接列表功能介绍该API用于查询该用户已创建的增强型跨源连接列表。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v2.0/{project_id}/datasource/enhanced-connections 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
查询Flink作业日志 - 数据湖探索 DLI

在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。在“工程配置”页面，选择“DLI作业桶”，单击配置桶信息。图1 工程配置单击打开桶列表。选择用于存放DLI作业临时数据的桶，并单击“确定”。完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。图2

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

云容器引擎-成长地图 | 华为云数据湖探索数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、HetuEngine生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需

 帮助中心 > 数据湖探索 DLI > 成长地图
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门
初始化DLI客户端 - 数据湖探索 DLI

在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。左侧导航栏单击“API凭证”，在“项目列表”中获取“项目ID”即为project_id值，对应的“项目”即为region的值。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi表必须执行Clean。对于Hudi的MOR、COW表，都需要开启Clean。 Hudi表在写入数据时会自动判断是否需要执行Clean，因为Clean的开关默认打开(hoodie.clean.automatic默认为true)。 Clean操作并不是每次写数据时都会触发，至少需要满足两个条件： Hud

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DLI作业开发流程 - 数据湖探索 DLI

DLI作业开发流程本节内容为您介绍DLI作业开发流程。创建IAM用户并授权使用DLI 如果您是企业用户，并计划使用IAM对您所拥有的DLI资源进行精细的权限管理，请创建IAM用户并授权使用DLI。具体操作请参考创建IAM用户并授权使用DLI。首次使用DLI您需要根据控制台的

 帮助中心 > 数据湖探索 DLI > 用户指南
初始化DLI客户端 - 数据湖探索 DLI

在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。左侧导航栏单击“API凭证”，在“项目列表”中获取“项目ID”即为project_id值，对应的“项目”即为region的值。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
提交SQL作业（废弃） - 数据湖探索 DLI

sql.shuffle.partitions（指定Shuffle过程中Partition的个数） dli.sql.cbo.enabled（是否打开CBO优化策略） dli.sql.cbo.joinReorder.enabled（开启CBO优化时，是否允许重新调整join的顺序）响应消息

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

功能总览功能总览全部数据湖探索权限管理弹性资源池 DLI元数据 DLI SQL作业 DLI Spark作业 DLI Flink作业跨源连接 DLI自定义委托自定义镜像 OBS 2.0支持数据湖探索数据湖探索（Data Lake Insight，以下简称DLI）是完全兼容Apache

帮助中心 > 数据湖探索 DLI > 功能总览
Flink作业常用操作 - 数据湖探索 DLI

作业权限。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入Flink作业管理页面。单击右上角“导出作业”，打开“导出作业”对话框。图2 导出作业选择保存作业的OBS桶。单击“下一步”。选择待导出的作业。默认导出所有作业，也可以勾选“自定义导出”选择需要导出的作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业

总条数： 98

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

查询增强型跨源连接 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

创建经典型跨源连接 - 数据湖探索 DLI

查询增强型跨源连接列表 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线