搜索_华为云

创建并提交SQL作业 - 数据湖探索 DLI

当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

驱动管理”，进入驱动管理界面。参考CDM管理驱动下载MySQL的驱动包到本地，将下载后驱动包本地解压，获取驱动的jar包文件。例如，当前下载MySQL驱动包压缩文件为“mysql-connector-java-5.1.48.zip”，解压后获取驱动文件“mysql-connector-java-5.1

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

示例桶名为“dli-test-obs01”。单击“上传对象”，将testdata.csv文件上传到OBS桶根目录下。在OBS桶根目录下，单击“新建文件夹”，创建名为“warehousepath”的文件夹。该文件夹路径用来存储Spark创建表的元数据信息“spark.sql.warehouse

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

COMPACTION 命令功能压缩( compaction)用于在 MergeOnRead表将基于行的log日志文件转化为parquet列式数据文件，用于加快记录的查找。命令格式 SCHEDULE COMPACTION on tableIdentifier |tablelocation;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

DELTA 命令功能 CONVERT TO DELTA 命令将现有的 Parquet 表就地转换为 Delta 表。此命令会列出目录中的所有文件，创建 Delta Lake 事务日志来跟踪这些文件，并通过读取所有 Parquet 文件的页脚来自动推断数据架构。转换过程会收集统计信息，以提升转换后的

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
数据迁移与传输方式概述 - 数据湖探索 DLI

导入数据至OBS DLI支持在不迁移数据的情况下，直接访问OBS中存储的数据进行查询分析。您只需将本地数据导入OBS即可开始使用DLI进行数据分析。导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
SDK的获取与安装 - 数据湖探索 DLI

操作请参考方法一：通过Maven安装DLI SDK依赖。在集成开发环境中导入JAR文件，适用于使用Eclipse作为集成开发环境的项目。具体操作请参考方法二：通过在Eclipse中导入JAR文件安装SDK。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
新建Flink Jar作业 - 数据湖探索 DLI

Strings 用户已上传到DLI资源管理系统的资源包名，用户自定义作业的依赖文件。示例："myGroup/test.cvs,myGroup/test1.csv"。通过在应用程序中添加以下内容可访问对应的依赖文件。其中，“fileName”为需要访问的文件名，“ClassName”为需要访问该文件的类名。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Flink Jar作业开发基础样例 - 数据湖探索 DLI

其他依赖文件用户自定义的依赖文件。在选择依赖文件之前需要将对应的文件上传至OBS桶中，并在“数据管理>程序包管理”中创建程序包，包类型没有限制，具体请参考创建程序包。通过在应用程序中添加以下内容可访问对应的依赖文件。其中，“fileName”为需要访问的文件名，“ClassName”为需要访问该文件的类名。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
导入数据（废弃） - 数据湖探索 DLI

导入数据（废弃）功能介绍该API用于将数据从文件导入DLI或OBS表，目前仅支持将OBS上的数据导入DLI或OBS中。当前接口已废弃，不推荐使用。该API为异步操作。导入数据时，可选择已存在的OBS桶路径或新建OBS桶路径，但只能指定一个OBS桶路径。若需新建OBS桶，需遵守以下命名规则：

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
导出SQL作业结果 - 数据湖探索 DLI

须不存在，如果指定目录已经存在，系统将返回错误信息，无法执行导出操作。覆盖指定路径：当计划导出某一个结果时，您可以选择一个已有的文件路径作为输出目录，如果这个路径下已有同名文件，将会自动覆盖这个文件，即原有的作业结果会被新导出的作业结果文件所替代。覆盖指定路径方式适用于在同一

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用DataSource语法创建OBS表 - 数据湖探索 DLI

OBS目录下包含子目录的场景：创建表时，若指定路径为OBS上的目录，且该目录下包含子目录（或嵌套子目录），则子目录下的所有文件类型及其内容也是表内容。您需要保证所指定的目录及其子目录下所有文件类型和建表语句中指定的存储格式一致，所有文件内容和表中的字段一致，否则查询将报错。您可以在建表语句OPTIO

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

若为true，则表示输出数据到taskmanager的error文件中。若为false，则表示输出数据到taskmanager的out中。示例从kafka中读取数据输出到taskmanager的out文件中，可以在taskmanager的out文件中看到输出结果。 create table kafkaSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
将OBS数据导入至DLI - 数据湖探索 DLI

径是文件将导致导入数据失败。当OBS的目录下有同名文件夹和文件时，数据导入指向该路径会优先指向文件而非文件夹。说明：路径同时支持文件和文件夹。 obs://DLI/sampledata.csv 表头:无/有当“文件格式”为“CSV”时该参数有效。设置导入数据源是否含表头。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
Hudi Archive操作说明 - 数据湖探索 DLI

Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Confluent Avro Format - 数据湖探索 DLI

根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka或ecs的地址 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
迁移数据场景概述 - 数据湖探索 DLI

迁移数据场景概述为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

样例代码演示将kafka数据处理后写入到OBS，具体参数配置请根据实际环境修改。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码（Flink 1.12）中“pom文件配置”说明。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

BY 1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
数据保护技术 - 数据湖探索 DLI

和性能综合考虑是否开启。证书文件还需要在作业配置页面的“其他依赖文件”中完成配置。 OBS路径/opt/flink/usrlib/userData/为默认存储依赖文件路径。请确保已上传密钥和证书到指定的OBS路径下，并在作业配置中的其他依赖文件中引入。表2 Flink作业传输通信加密配置参数

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全

总条数： 455

上一页
1
2
3
4
5
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建并提交SQL作业 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线