搜索_华为云

常用操作与系统权限关系 - 数据湖探索 DLI

显示表信息 √ × √ √ 弹性资源池 DROP 删除弹性资源池 √ × √ √ RESOURCE_MANAGEMENT 弹性资源池资源管理 √ × √ √ SCALE 扩缩容弹性资源池 √ × √ √ UPDATE 更新弹性资源池 √ × √ √ CREATE 创建弹性资源池 √ × √

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

在管理控制台右上角，选择“工单 > 新建工单”，提交申请。使用前您需要先创建一个HetuEngine类型的SQL队列，具体操作请参考创建弹性资源池并添加队列。 HetuEngine SQL需搭配lakeformation使用。详细内容请参考DLI对接LakeFormation。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没有包含分

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
流生态作业开发指引 - 数据湖探索 DLI

QL从这些服务中读写数据，如DIS、OBS、CloudTable、MRS、RDS、SMN、DCS等。开源生态通过对等连接建立与其他VPC的网络连接后，用户可以在DLI的租户独享集群中访问所有Flink和Spark支持的数据源与输出源，如Kafka、Hbase、ElasticSearch等。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理问题1：将代码直接复制到py文件中后，'\'后出现“unexpected character”问题。问题将代码直接复制到py文件中后，'\'后出现“unexpected character”问题。解决方案将'\'后面的缩进或是空格全部删除。父主题：对接Redis

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
Hudi常见配置参数 - 数据湖探索 DLI

置为0，会关闭此功能。由于批处理中分区中插入记录的数量众多，总会出现小文件。Hudi提供了一个选项，可以通过将对该分区中的插入作为对现有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
配置DLI作业桶 - 数据湖探索 DLI

操作前准备配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
用户通过CTAS创建hive表报schema解析异常错误 - 数据湖探索 DLI

目前DLI支持hive语法创建TEXTFILE、SEQUENCEFILE、RCFILE、ORC、AVRO、PARQUET文件类型的表。如果用户CTAS建表指定的文件格式为AVRO类型，而且直接使用数字作为查询语句（SELECT）的输入，如“CREATE TABLE tb_avro STORED

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
FileSystem结果表 - 数据湖探索 DLI

uid会重新生成。文件合并 FileSink 开始支持已经提交Pending文件的合并，从而允许应用设置一个较小的时间周期并且避免生成大量的小文件。这一功能开启后，在文件转为Pending状态与文件最终提交之间会进行文件合并。这些Pending状态的文件将首先被提交为一个以.

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用DataSource语法创建OBS表 - 数据湖探索 DLI

更多建表时的属性名与属性值请参考表2。 file_format为csv时表的属性名与属性值请参考表2和表3。当OBS的目录下文件夹与文件同名时，创建OBS表指向的路径会优先指向文件而非文件夹。 table_comment 否表描述信息。仅支持字符串常量。 select_statement 否用于CTAS命令，将

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Hive语法创建OBS表 - 数据湖探索 DLI

obs_path 是数据文件所在的OBS存储路径，推荐使用OBS并行文件系统存储。格式：obs://bucketName/tblPath bucketName即桶名称。 tblPath是目录名称。目录后不需要指定文件名。当OBS的目录下文件夹与文件同名时，创建OBS表指向的路径会优先指向文件而非文件夹。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
管理增强型跨源连接 - 数据湖探索 DLI

管理增强型跨源连接查看增强型跨源连接的基本信息增强型跨源连接权限管理增强型跨源连接绑定弹性资源池增强型跨源连接与弹性资源池解绑添加增强型跨源连接的路由信息删除增强型跨源连接的路由信息修改弹性资源池的主机信息增强型跨源连接标签管理删除增强型跨源连接父主题：配置DLI读写外部数据源数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。通过管理控制台创建跨源连接请参考《数据湖探索用户指南》。通过AP

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
计费相关问题 - 数据湖探索 DLI

怎样查看套餐包资源的使用情况？怎样查看DLI的数据扫描量？按需计费的弹性资源池，如果没提交作业运行就不计费？想要使用扫描套餐包计费，购买队列还要额外收费吗？超出套餐包额度的使用量怎么收费？弹性资源池的实际CUs、CU范围、规格的含义包年包月弹性资源池设置了定时扩缩容时，怎样计费？

帮助中心 > 数据湖探索 DLI > 计费说明
Spark开源命令支持说明 - 数据湖探索 DLI

DATABASE testDB SET DBPROPERTIES ('Edited-by' = 'John'); 不支持不支持修改数据库在OBS上的文件存放路径 ALTER DATABASE testDB SET LOCATION 'obs://bucketName/filePath'; 不支持

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
FileSytem结果表 - 数据湖探索 DLI

FileSytem结果表功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
在DLI控制台创建数据库和表 - 数据湖探索 DLI

步骤。 View只能通过SQL语句进行创建，不能通过“创建表”页面进行创建。注意事项当OBS的目录下有同名文件夹和文件时，创建OBS表指向该路径会优先指向文件而非文件夹。创建数据库和表时，有权限控制，需要对其他用户授权，其他用户才可查看该用户新建的数据库和表。具体请参考常用操作与系统权限关系。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

跨源认证相关API 包括创建跨源认证、获取跨源认证列表、更新跨源认证、删除跨源认证API。弹性资源池相关API 包括创建弹性资源池、查询所有弹性资源池、删除弹性资源池、修改弹性资源池信息等。队列相关API（推荐）包括创建队列、删除队列、查询所有队列、修改队列网段、重启/

帮助中心 > 数据湖探索 DLI > API参考
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 545

上一页
1
...
16
17
18
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常用操作与系统权限关系 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

用户通过CTAS创建hive表报schema解析异常错误 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

管理增强型跨源连接 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

计费相关问题 - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线