搜索_华为云

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

quet数据。将CSV数据导入DLI，并将CSV数据转换为Parquet数据。方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

csv options (path 'obs://obs1'); 创建表时只需指定数据文件所在的OBS存储路径，目录后不需要指定文件名。表table1创建成功后，单击左侧“数据库”页签，再单击db1，新创建的表table1会在“表”区域下方显示。步骤5：查询数据完成以上步骤后，就可以开始进行数据查询了。

帮助中心 > 数据湖探索 DLI > 快速入门
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

查询，生成了csv数据文件，文件内容为insert插入的数据内容。图4 查询结果指定的OBS数据目录包含数据文件。在OBS桶“dli-test-021”根目录下创建数据文件目录“data2”。创建如下内容的测试数据文件“test.csv”，并上传文件到“obs://dli-test-021/data2”目录下。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
（推荐）DLI SDK V3 - 数据湖探索 DLI

huaweicloud-sdk-go-v3 Go SDK使用指导 Go SDK视频指导 Node.js huaweicloud-sdk-nodejs-v3 Node.js SDK使用指导 Node.js SDK视频指导 .NET huaweicloud-sdk-net-v3 .NET SDK使用指导

 帮助中心 > 数据湖探索 DLI > SDK参考
修改表生命周期的时间 - 数据湖探索 DLI

功能描述修改已存在的分区表或非分区表的生命周期。当第一次开启生命周期时，会扫描表/分区会扫描路径下的表数据文件，更新表/分区的LAST_ACCESS_TIME，耗时与分区数和文件数相关。约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。表生命周期功能支持Hi

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 表生命周期管理
修改表生命周期的时间 - 数据湖探索 DLI

功能描述修改已存在的分区表或非分区表的生命周期。当第一次开启生命周期时，会扫描表/分区会扫描路径下的表数据文件，更新表/分区的LAST_ACCESS_TIME，耗时与分区数和文件数相关。约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。表生命周期功能支持Hi

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

恢复保存点”，作业将从选择的savepoint文件中恢复消费位点及状态。同时，由于Flink Checkpoint和Savepoint生成机制及格式一致，因而，也可以通过Flink作业列表“操作”列中的“更多”>“导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Flink作业常用操作 - 数据湖探索 DLI

单击右上角“导入作业”，打开“导入作业”对话框。选择需导入的作业配置文件的完整OBS路径。单击“下一步”。配置同名作业策略。单击“下一步”。勾选“配置同名替换”，如果待导入的作业名已存在，则覆盖已存在的作业配置，并且作业状态重置为草稿。不勾选“配置同名替换”，如果待导入的作业名已存在，则不导入同名作业的配置。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

创建DLI表时不支持指定存储路径。数据导入仅支持将OBS上的数据导入DLI或OBS中。支持将OBS中CSV，Parquet，ORC，JSON和Avro格式的数据导入到在DLI中创建的表。将CSV格式数据导入分区表，需在数据源中将分区列放在最后一列。导入数据的编码格式仅支持UTF-8。

帮助中心 > 数据湖探索 DLI > 产品介绍
创建程序包 - 数据湖探索 DLI
创建程序包 - 数据湖探索 DLI

支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件 File：用户文件 ModelFile：用户AI模型文件 OBS路径选择对应程序包的OBS路径。说明：程序包需提前上传至OBS服务中保存。只支持选择文件。分组设置可选择“已有分组”，“创建新分组”或“不分组”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
配置多版本过期数据回收站 - 数据湖探索 DLI

法可以参考使用Hive语法创建OBS表。回收站数据自动清理需要在OBS并行文件系统的桶上配置回收站数据的生命周期规则。具体步骤参考如下：在OBS服务控制台页面左侧选择“并行文件系统”，单击对应的文件系统名称。在“基础配置”下单击“生命周期规则”，创建或者编辑生命周期规则。图1

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 多版本备份恢复数据
配置多版本过期数据回收站 - 数据湖探索 DLI

法可以参考使用Hive语法创建OBS表。回收站数据自动清理需要在OBS并行文件系统的桶上配置回收站数据的生命周期规则。具体步骤参考如下：在OBS服务控制台页面左侧选择“并行文件系统”，单击对应的文件系统名称。在“基础配置”下单击“生命周期规则”，创建或者编辑生命周期规则。图1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
使用DLI进行车联网场景驾驶行为数据分析 - 数据湖探索 DLI

击桶dli-demo。OBS Browser+提供强大的拖拽上传功能，您可以将本地的一个或多个文件或者文件夹拖拽到对象存储的对象列表或者并行文件系统的对象列表中；同时您也可以将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_01.zi

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
提交SQL作业（废弃） - 数据湖探索 DLI

当前接口已废弃，不推荐使用。作业包含以下类型：DDL、DCL、IMPORT、EXPORT、QUERY和INSERT。其中，IMPORT和EXPORT分别与导入数据（废弃）和与导出数据（废弃）的功能一致，区别仅在于实现方式不同。另外，用户可使用其他API来对作业进行查询和管理。具体操作有：查询作业状态

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
db - 数据湖探索 DLI
db - 数据湖探索 DLI

db_name 格式无。说明数据库名称，仅支持字符串类型，名称长度不能超过128字节。父主题：标示符

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 标示符
db - 数据湖探索 DLI
db - 数据湖探索 DLI

db_name 格式无。说明数据库名称，仅支持字符串类型，名称长度不能超过128字节。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
添加分区（只支持OBS表） - 数据湖探索 DLI

LOCATION 'obs_path'。若新增分区指定的路径包含子目录（或嵌套子目录），则子目录下面的所有文件类型及内容也将作为该分区的记录。您需要保证该分区目录下所有文件类型和文件内容与表的字段一致，否则查询将报错。您可以在建表语句OPTIONS中设置“multiLevelDir

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
在DLI控制台创建数据库和表 - 数据湖探索 DLI

输入或选择OBS路径。路径可以是文件夹，也可以是路径。说明：如果需要将OBS上的数据导入OBS表，则建表路径必须是文件夹。建表路径是文件时，会导致数据导入失败。 obs://obs1/sampledata.csv 表头:无/有当“数据格式”为“CSV”时，该参数有效。设置导入数据源是否含表头。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
db - 数据湖探索 DLI
db - 数据湖探索 DLI

db_comment 格式无。说明对数据库的描述，仅支持字符串类型，描述长度不能超过256字节。父主题：标示符

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 标示符

总条数： 517

上一页
1
...
4
5
6
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

创建程序包 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

使用DLI进行车联网场景驾驶行为数据分析 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

db - 数据湖探索 DLI

db - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

db - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线