搜索_华为云

数据保护技术 - 数据湖探索 DLI

和性能综合考虑是否开启。证书文件还需要在作业配置页面的“其他依赖文件”中完成配置。 OBS路径/opt/flink/usrlib/userData/为默认存储依赖文件路径。请确保已上传密钥和证书到指定的OBS路径下，并在作业配置中的其他依赖文件中引入。表2 Flink作业传输通信加密配置参数

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间 Parquet还支持灵

 帮助中心 > 数据湖探索 DLI > 最佳实践
SHOW_COMMIT_FILES - 数据湖探索 DLI
SHOW_COMMIT_FILES - 数据湖探索 DLI

指定的instant所更新或插入的文件位于哪个分区 file_id 指定的instant所更新或插入的文件的ID previous_commit 指定的instant所更新或插入的文件的文件名中的时间戳 total_records_updated 该文件中多少个record被更新 t

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
配置多版本过期数据回收站 - 数据湖探索 DLI

法可以参考使用Hive语法创建OBS表。回收站数据自动清理需要在OBS并行文件系统的桶上配置回收站数据的生命周期规则。具体步骤参考如下：在OBS服务控制台页面左侧选择“并行文件系统”，单击对应的文件系统名称。在“基础配置”下单击“生命周期规则”，创建或者编辑生命周期规则。图1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

xml文件配置请参考JAVA样例代码（Flink 1.12）中“pom文件配置”说明。确保本地编译环境可以正常访问公网。约束与限制需要在DLI控制台下“全局配置 > 服务授权”开启Tenant Adminstrator（全局服务）。写入数据到OBS的桶必须为主账号下所创建的OBS桶。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
使用DataSource语法创建DLI表 - 数据湖探索 DLI

默认值 multiLevelDirEnable 否是否迭代查询子目录中的数据。当配置为true时，查询该表时会迭代读取该表路径中所有文件，包含子目录中的文件。 false compression 否指定压缩格式。一般为parquet格式时指定该参数，推荐使用'zstd'压缩格式。 -

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

schema_name 描述 DATABASE和SCHEMA在此处是等价的，可互换的，它们有这相同的含义。该语法用于显示SCHEMA的名称、注释、还有它在文件系统上的根路径。可选项EXTENDED可以用来显示SCHEMA的数据库属性。示例 CREATE SCHEMA web; DESCRIBE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。数据结果参考如下： +I(fz-source-json,0,{}

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

ency、Isolation、Durability）能力，有助于确保数据的一致性和准确性。了解更多：执行Insert into后数据重复怎么办？语法格式将SELECT查询结果插入到表中 1 2 INSERT INTO [TABLE] [db_name.]table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
SHOW_HOODIE_PROPERTIES - 数据湖探索 DLI

SHOW_HOODIE_PROPERTIES 命令功能查看指定hudi表的hoodie.properties文件中的配置。命令格式 call show_hoodie_properties(table => '[table_name]'); 参数描述表1 参数描述参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

快照查询（Snapshot Queries）可以读到最新的commit/compaction产生的快照。对于MOR表，还会在查询中合并最新的delta log文件的内容，使读取的数据近实时。增量查询增量查询（Incremental Queries）只会查询到给定的commit/compaction之后新增的数据。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

module_name 否 String 资源模块名 module_type 否 String 资源模块类型。 jar：用户jar文件; pyFile：用户python文件; file：用户文件。表4 details参数说明参数名称是否必选参数类型说明 create_time 否 Long

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
修改表分区位置（只支持OBS表） - 数据湖探索 DLI

PARTITION partition_specs SET LOCATION obs_path; 关键字 PARTITION：分区。 LOCATION：分区路径。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
查询分组资源列表（废弃） - 数据湖探索 DLI

参数名称是否必选参数类型说明 kind 否 String 指定文件类型。包括以下文件类型： jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。 tags 否 String 指定标签过滤。请求消息无请求参数。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
上传file类型分组资源（废弃） - 数据湖探索 DLI

module_name 否 String 资源模块名 module_type 否 String 资源模块类型。 jar：用户jar文件; pyFile：用户python文件; file：用户文件。表4 details参数说明参数名称是否必选参数类型说明 create_time 否 Long

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

'obs://....') using json：指定使用 JSON 格式。 options：用于设置表的选项。 path：指定OBS中JSON文件的路径。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

CLEAN 命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
上传分组资源（废弃） - 数据湖探索 DLI

kind 是 String 分组资源文件的类型。 jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。说明：上传的同一组资源包含不同文件类型时，均选择“file”类型作为这次上传文件的类型。 group 是 String

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
上传jar类型分组资源（废弃） - 数据湖探索 DLI

module_name 否 String 资源模块名 module_type 否 String 资源模块类型。 jar：用户jar文件; pyFile：用户python文件; file：用户文件。表4 details参数说明参数名称是否必选参数类型说明 create_time 否 Long

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）

总条数： 443

上一页
1
...
6
7
8
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据保护技术 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

SHOW_COMMIT_FILES - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

SHOW_HOODIE_PROPERTIES - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

上传file类型分组资源（废弃） - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

上传jar类型分组资源（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线