搜索_华为云

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

为Parquet数据。方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间

 帮助中心 > 数据湖探索 DLI > 最佳实践
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

支持三种计费模式：按照包年/包月的订购周期计费根据计算资源使用量（CU时）按需计费。按预购的套餐包计费。支持包年包月+按需组合使用（超出包周期规格按需计费）；支持套餐包+按需计费组合使用（超出套餐包使用量按需计费）。存储计费按照存储在DLI服务中的表数据存储量（单位为“GB”）收取存储费用。

帮助中心 > 数据湖探索 DLI > 计费说明
INSERT - 数据湖探索 DLI
INSERT - 数据湖探索 DLI

INSERT 命令功能 INSERT命令用于将SELECT查询结果加载到Delta表中。命令格式追加模式： INSERT INTO [database_name.]table_name|DELTA.`obs://bucket_name/tbl_path` select query;

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie // 元数据文件夹 │ ├── .aux │ ├── .cleanData

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
SparkSQL建表参数规范 - 数据湖探索 DLI

参数名称参数描述输入值说明 primaryKey hudi主键按需必须指定，可以是复合主键但是必须全局唯一。 preCombineField 预合并键，相同主键的多条数据按该字段进行合并按需必须指定，相同主键的数据会按该字段合并，不能指定多个字段。禁止建表时将hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
配置DLI作业桶 - 数据湖探索 DLI

操作前准备配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

程序包程序包支持删除，但不支持删除程序包组。支持上传的程序包类型： JAR：用户jar文件。 PyFile：用户Python文件。 File：用户文件。 ModelFile：用户AI模型文件。增强型跨源连接约束限制更多增强型跨源连接约束限制请参考增强型跨源连接概述。表7 增强型跨源连接约束限制

 帮助中心 > 数据湖探索 DLI > 产品介绍
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理问题1：将代码直接复制到py文件中后，'\'后出现“unexpected character”问题。问题将代码直接复制到py文件中后，'\'后出现“unexpected character”问题。解决方案将'\'后面的缩进或是空格全部删除。父主题：对接Redis

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
用户通过CTAS创建hive表报schema解析异常错误 - 数据湖探索 DLI

目前DLI支持hive语法创建TEXTFILE、SEQUENCEFILE、RCFILE、ORC、AVRO、PARQUET文件类型的表。如果用户CTAS建表指定的文件格式为AVRO类型，而且直接使用数字作为查询语句（SELECT）的输入，如“CREATE TABLE tb_avro STORED

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
使用DataSource语法创建OBS表 - 数据湖探索 DLI

更多建表时的属性名与属性值请参考表2。 file_format为csv时表的属性名与属性值请参考表2和表3。当OBS的目录下文件夹与文件同名时，创建OBS表指向的路径会优先指向文件而非文件夹。 table_comment 否表描述信息。仅支持字符串常量。 select_statement 否用于CTAS命令，将

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Hive语法创建OBS表 - 数据湖探索 DLI

obs_path 是数据文件所在的OBS存储路径，推荐使用OBS并行文件系统存储。格式：obs://bucketName/tblPath bucketName即桶名称。 tblPath是目录名称。目录后不需要指定文件名。当OBS的目录下文件夹与文件同名时，创建OBS表指向的路径会优先指向文件而非文件夹。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
对象存储OBS结果表 - 数据湖探索 DLI

uid会重新生成。文件合并 FileSink 开始支持已经提交Pending文件的合并，从而允许应用设置一个较小的时间周期并且避免生成大量的小文件。这一功能开启后，在文件转为Pending状态与文件最终提交之间会进行文件合并。这些Pending状态的文件将首先被提交为一个以.

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
FileSytem结果表 - 数据湖探索 DLI

FileSytem结果表功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
FileSystem结果表 - 数据湖探索 DLI

uid会重新生成。文件合并 FileSink 开始支持已经提交Pending文件的合并，从而允许应用设置一个较小的时间周期并且避免生成大量的小文件。这一功能开启后，在文件转为Pending状态与文件最终提交之间会进行文件合并。这些Pending状态的文件将首先被提交为一个以.

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

operation.incremental.collect kyuubi会预加载select结果数据到缓存加快读取数据，数据量较大的场景防止内存OOM建议关闭。否 false 配置为false代表关闭预加载。 kyuubi.engine.jdbc.memory jdbc engine进程内存

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

operation.incremental.collect kyuubi会预加载select结果数据到缓存加快读取数据，数据量较大的场景防止内存OOM建议关闭。否 false 配置为false代表关闭预加载。 kyuubi.engine.jdbc.memory jdbc engine进程内存

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

INSERT INTO 命令功能 INSERT命令用于将SELECT查询结果加载到Hudi表中。命令格式 INSERT INTO tableIndentifier select query; 参数描述表1 INSERT INTO参数参数描述 tableIndentifier

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
手动续费 - 数据湖探索 DLI
手动续费 - 数据湖探索 DLI

单击“控制台”页面上方“费用与成本”，在下拉菜单中选择“续费管理”。进入“续费管理”页面。自定义查询条件。可在“手动续费项”、“自动续费项”、“到期转按需项”、“到期不续费项”页签查询全部待续费资源，对资源进行手动续费的操作。图2 续费管理所有需手动续费的资源都可归置到“手动续费项”页签，具体操作请参见如何恢复为手动续费。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Jar 读取用户自定义配置文件的方式相比Flink 1.12存在差异。详细操作说明请参考使用Flink Jar写入数据到OBS开发指南。 Flink 1.15 Jar 程序，采用反向类加载机制（child-first），可通过优化参数设置某些依赖包由父类加载器加载：parent.first

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考

总条数： 381

上一页
1
2
3
4
5
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

INSERT - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

用户通过CTAS创建hive表报schema解析异常错误 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

手动续费 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线