搜索_华为云

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

xxx/testdli0617/spark:2.4.5.tensorflow 在DLI服务中提交Spark或者Flink jar作业时选择自定义镜像。打开管理控制台的Spark作业或者Flink作业编辑页面，在自定义镜像列表中选择已上传并共享的镜像，运行作业，即可使用自定义镜像运行作业。如

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
配置DLI读写外部数据源数据 - 数据湖探索 DLI

配置DLI读写外部数据源数据配置DLI读写外部数据源数据的操作流程配置DLI与数据源网络连通（增强型跨源连接）使用DEW管理数据源访问凭证使用DLI的跨源认证管理数据源访问凭证管理增强型跨源连接典型场景示例：配置DLI与内网数据源的网络联通典型场景示例：配置DLI 与公网网络连通

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
FileSystem结果表 - 数据湖探索 DLI

Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row Formats默认的策略是根据Part文件大小进行滚动，需要指定文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk Formats在每次创建Checkpoint时进行滚动，并且用户也可以添加基于大小或者时间等的其他条件。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
如何获取AK/SK？ - 数据湖探索 DLI

在左侧导航栏单击“访问密钥”。单击“新增访问密钥”，进入“新增访问密钥”页面。根据提示输入对应信息，单击“确定”，在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。为防止访问密钥泄露，建议您将其保存到安全的位置。父主题： DLI API类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？问题现象客户创建增强型跨源连接DLI和DWS，安全组已配置出方向规则到关联队列，使用的是密码形式的跨源认证，报DLI.0999: PSQLException: The connection attempt failed。原因分析出现该问题可能原因如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
增强型跨源连接类 - 数据湖探索 DLI

增强型跨源连接类增强型跨源连接绑定队列失败怎么办？ DLI增强型跨源连接DWS失败怎么办？创建跨源成功但测试网络连通性失败怎么办？怎样配置DLI队列与数据源的网络连通？为什么DLI增强型跨源连接要创建对等连接？ DLI创建跨源连接，绑定队列一直在创建中怎么办？新建跨源连

 帮助中心 > 数据湖探索 DLI > 常见问题
SDK获取与安装 - 数据湖探索 DLI

SDK 下载并解压SDK安装包。将"dli-sdk-python-<version>.zip"解压到本地目录，目录可自行调整。安装SDK。打开Windows操作系统“开始”菜单，输入cmd命令。在命令行窗口，进入“dli-sdk-python-<version>.zip”解压目

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池操作场景如果其他弹性资源池想要通过已创建的增强型跨源连接来连接数据源，可以在增强型跨源连接页面绑定弹性资源池。本节的操作指导介绍增强型跨源连接绑定弹性资源池的操作指导。约束限制增强型跨源仅支持包年包月队列和按需专属的弹性资源池/队列。绑定跨源的DLI队列网段和数据源网段不能重合。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。根据该验证方式，初步定位是因为文件数据量较大，文本编辑器无法全部读取。通过执行查询语句，查询OBS数据进一步进行确认，查询结果确认数据量正确。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述该场景为对汽车驾驶的实时数据信息进行分析，将满足特定条件的数据结果进行汇总。汽车驾驶的实时数据信息为数据源发送到Kafka中，再将Kafka数据的分析结果输出到DWS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Hudi数据表Archive规范 - 数据湖探索 DLI

对于Hudi的MOR类型和COW类型的表，都需要开启Archive。 Hudi表在写入数据时会自动判断是否需要执行Archive，因为Archive的开关默认打开(hoodie.archive.automatic默认为true)。 Archive操作并不是每次写数据时都会触发，至少需要满足以下两个条件：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch 本指导仅适用于Flink 1.12版本。场景描述本示例场景对用户购买商品的数据信息进行分析，将满足特定条件的数据结果进行汇总输出。购买商品数据信息为数据源发送到Kafka中，再将Kafka数据的分析结果输出到Elasticsearch中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
配置DLI作业桶 - 数据湖探索 DLI

在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。在“工程配置”页面，选择“DLI作业桶”，单击配置桶信息。图1 工程配置单击打开桶列表。选择用于存放DLI作业临时数据的桶，并单击“确定”。完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。图2

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
DLI经典型跨源连接下线（EOL）公告 - 数据湖探索 DLI

DLI经典型跨源连接下线（EOL）公告公告说明华为云计划于2024年06月30 00:00（北京时间）将DLI经典型跨源连接的相关功能下线（EOL）。影响 DLI经典型跨源连接的相关功能下线（EOL）后，不再提供该功能任何技术服务与支持。如果您正在使用DLI经典型跨源连接

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Python SDK环境配置 - 数据湖探索 DLI

选择SDK获取与安装获取的安装包，解压安装包。将"dli-sdk-python-<version>.zip"解压到本地目录，目录可自行调整。安装SDK。打开Windows操作系统“开始”菜单，输入cmd命令。在命令行窗口，进入“dli-sdk-python-<version>.zip”解压目

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移数据仓库服务DWS数据至DLI。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI队列时队列类型需要选择为“SQL队列”。已创建数据仓库服务DWS集群。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移Elasticsearch类型的CSS集群数据至DLI。其他自建的Elasticsearch等服务数据，均可以通过CDM与DLI进行双向同步。前提条件已创建DLI的SQL队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移关系型数据库RDS数据至DLI。其他关系型数据库数据都可以通过CDM与DLI进行双向同步。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI队列时队列类型需要选择为“SQL队列”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI

总条数： 98

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

配置DLI读写外部数据源数据 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

如何获取AK/SK？ - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

增强型跨源连接类 - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

DLI经典型跨源连接下线（EOL）公告 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线