搜索_华为云

查询Spark作业日志 - 数据湖探索 DLI

前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

用场景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

用场景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DLI作业开发流程 - 数据湖探索 DLI

性资源池并添加队列。您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在

 帮助中心 > 数据湖探索 DLI > 用户指南
Hudi Archive操作说明 - 数据湖探索 DLI

Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Hudi Compaction操作说明 - 数据湖探索 DLI

Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进行不阻塞摄入的异步Compaction很有意义。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Delta清理和优化 - 数据湖探索 DLI

前创建的数据文件。 VACUUM delta_table0; VACUUM delta_table0 RETAIN 168 HOURS;--单位只支持HOURS 优化Delta表为了提高查询速度，Delta Lake支持优化数据在存储中的布局，这会将许多较小的文件压缩为较大的文件。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Sp

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”或“jobmanager”的文件夹进入，下载获取taskmanager.out和jobmanager.out文件查看结果日志。验证跨源是否正确绑定且安全组规则已对该队列开放。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hudi表使用约束 - 数据湖探索 DLI

写时复制表也简称COW表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
导出DLI表数据至OBS中 - 数据湖探索 DLI

支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。支持跨账号导出数据，即，如果B

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

COMPACTION 命令功能压缩( compaction)用于在 MergeOnRead表将基于行的log日志文件转化为parquet列式数据文件，用于加快记录的查找。命令格式 SCHEDULE COMPACTION on tableIdentifier |tablelocation;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
查询作业详情 - 数据湖探索 DLI

"entrypoint_args": null, "status": "job_cancel_success" } } 状态码状态码如表5所示。表5 状态码状态码描述 200 查询作业详情成功。 400 输入参数无效。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
SDK的获取与安装 - 数据湖探索 DLI

操作请参考方法一：通过Maven安装DLI SDK依赖。在集成开发环境中导入JAR文件，适用于使用Eclipse作为集成开发环境的项目。具体操作请参考方法二：通过在Eclipse中导入JAR文件安装SDK。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

DELTA 命令将现有的 Parquet 表就地转换为 Delta 表。此命令会列出目录中的所有文件，创建 Delta Lake 事务日志来跟踪这些文件，并通过读取所有 Parquet 文件的页脚来自动推断数据架构。转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie // 元数据文件夹 │ ├── .aux │ ├── .cleanData

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

配分区。展示的信息将包括表的基本信息和相关的文件系统信息，其中文件系统信息包括总文件数、总文件大小、最大文件长度、最小文件长度、最后访问时间以及最后更新时间。如果指定了分区，将给出指定分区的文件系统信息，而不是分区所在表的文件系统信息。参数说明 IN | FROM schema_name

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理问题1：将代码直接复制到py文件中后，'\'后出现“unexpected character”问题。问题将代码直接复制到py文件中后，'\'后出现“unexpected character”问题。解决方案将'\'后面的缩进或是空格全部删除。父主题：对接Redis

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？问题现象创建OBS外表，因为指定的OBS文件内容中某字段包含回车换行符导致表字段数据错误。例如，当前创建的OBS外表语句为： CREATE TABLE test06 (name string, id

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类

总条数： 707

上一页
1
...
4
5
6
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询Spark作业日志 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

Delta清理和优化 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线