搜索_华为云

导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入OBS表时，创建OBS表时指定的路径必须是文件夹，若建表路径是文件将导致导入数据失败。仅支持导入位于OBS路径上的原始数据。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。导入数据时只能指定一个路径，路径中不能包含逗号。当OBS桶目录下有文件夹和文件同名时，导入数据会优先指向该路径下的文件而非文件夹。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否数据库认证用户名，需要和'connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否访问数据库所需要的账号 connector.password

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
数据迁移与传输方式概述 - 数据湖探索 DLI

迁移数据至DLI 配置DLI读写外部数据源如果您不想将数据导入OBS或DLI的数据表中，DLI提供的跨源访问能力，支持您在不迁移数据的情况下，连接数据源获取数据并进行数据分析。具体操作请参考配置DLI读写外部数据源数据的操作流程。父主题：数据迁移与数据传输

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

支持特性增量快照读取增量快照读取是一种读取表快照的新机制。与旧的快照机制相比，增量快照具有许多优点，包括：在快照读取期间，Source 支持并发读取，在快照读取期间，Source 支持进行 chunk 粒度的 checkpoint，在快照读取之前，Source 不需要数据库锁权限。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
导出查询结果 - 数据湖探索 DLI

BS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute by rand()”，可以增加处理作业的并发量。例如： insert into table table_target select * from table_source distribute

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
创建JDBC维表 - 数据湖探索 DLI
创建JDBC维表 - 数据湖探索 DLI

connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否数据库认证用户名，需要和'connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
新建Flink Jar作业 - 数据湖探索 DLI

用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。 log_enabled 否 Boolean 是否开启作业日志。开启：true 关闭：false 默认：false obs_bucket

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
更新Flink Jar作业 - 数据湖探索 DLI

用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。默认值为“1”。 log_enabled 否 Boolean 是否开启作业日志。开启：true 关闭：false 默认：false obs_bucket

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

getCheckpointConfig().setCheckpointTimeout(60000); // 设置checkpoint最大并发数 streamEnv.getCheckpointConfig().setMaxConcurrentCheckpoints(1);

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
查询经典型跨源连接列表 - 数据湖探索 DLI

connections 否 Array of Objects 跨源连接信息列表，详细信息请参考表3。 count 否 Integer 跨源连接数量。表3 connections参数参数名称是否必选参数类型说明 is_success 否 Boolean 执行请求是否成功。“true”表示请求执行成功。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

创建Spark作业 Spark作业编辑页面支持执行Spark作业，为用户提供全托管式的Spark计算服务。在总览页面，单击Spark作业右上角的“创建作业”，或在Spark作业管理页面，单击右上角的“创建作业”，均可进入Spark作业编辑页面。进入Spark作业编辑页面，页面

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
导入数据（废弃） - 数据湖探索 DLI

），访问桶或对象时可能会进行安全证书校验。导入源文件时，如果源文件中的某一列与目标表列类型不匹配，将会导致该行数据的查询结果为null 。不支持并发导入同一张表。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1.0/{project_id}/jobs/import-table

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

示、按组批量启动作业、按分组导出作业等操作。是否定时执行：如果需要配置作业定时自动执行，请参见配置定时任务。这里保持默认值“否”。抽取并发数：设置同时执行的抽取任务数。这里保持默认值“1”。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入O

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
ClickHouse结果表 - 数据湖探索 DLI

数据库名为ClickHouse集群创建的数据库名称。 connector.table 是要创建的ClickHouse的表名。 connector.driver 否连接数据库所需要的驱动。如果建表时不指定该参数，驱动会自动通过ClickHouse的url提取。如果建表时指定该参数，则该参数值固定为“ru

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Flink Jar作业开发基础样例 - 数据湖探索 DLI

并行数作业中每个算子的最大并行数。说明：并行数不能大于计算单元（CU数量-管理单元CU数量）的4倍。并行数最好大于用户作业里设置的并发数，否则有可能提交失败。 TaskManager配置用于设置TaskManager资源参数。勾选后需配置下列参数： “单TM所占CU数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

示、按组批量启动作业、按分组导出作业等操作。是否定时执行：如果需要配置作业定时自动执行，请参见配置定时任务。这里保持默认值“否”。抽取并发数：设置同时执行的抽取任务数。这里保持默认值“1”。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入O

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

示、按组批量启动作业、按分组导出作业等操作。是否定时执行：如果需要配置作业定时自动执行，请参见配置定时任务。这里保持默认值“否”。抽取并发数：设置同时执行的抽取任务数。这里保持默认值“1”。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入O

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Hudi Clustering操作说明 - 数据湖探索 DLI

Clustering服务基于Hudi的MVCC设计，允许继续插入新数据，而Clustering操作在后台运行以重新格式化数据布局，从而确保并发读写者之间的快照隔离。总体而言Clustering分为两个部分：调度Clustering：使用可插拔的Clustering策略创建Clustering计划。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略弹性资源池上可以添加多个不同队列用于作业运行，具体添加弹性资源池添加队列的操作可以参考创建弹性资源池并添加队列。添加完队列后，可以根据不同队列计算资源使用量的波峰和波谷和优先级来配置要扩缩容的CU数，从而来保障作业的稳定运行。注意事项建议对流

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池

总条数： 120

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导入数据 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

创建JDBC维表 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

查询经典型跨源连接列表 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线