搜索_华为云

导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入OBS表时，创建OBS表时指定的路径必须是文件夹，若建表路径是文件将导致导入数据失败。仅支持导入位于OBS路径上的原始数据。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。导入数据时只能指定一个路径，路径中不能包含逗号。当OBS桶目录下有文件夹和文件同名时，导入数据会优先指向该路径下的文件而非文件夹。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。对于Hudi的MOR类型和COW类型的表，都需要开启Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_insert：该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高的，但是无法控制小文件，而upser

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

</dependency> </dependencies> 图5 pom文件中添加配置在工程路径的“src > main > java”文件夹上鼠标右键，选择“New > Package”，新建Package和类文件。图6 新建Package和类文件 Package根据需要定义，本示例定义为：“com

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI弹性资源池与队列简介 - 数据湖探索 DLI

购买弹性资源池并在弹性资源池中添加队列的具体操作步骤请参考创建弹性资源池并添加队列。全局共享模式：全局共享模式是一种根据SQL查询中实际扫描的数据量来分配计算资源的模式，不支持指定或预留计算资源。 DLI服务预置的“default”队列即为全局共享模式的计算资源，资源的大小是按需分配的。在不确定数据量大小或

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

OBS表压缩率较高怎么办？当您在提交导入数据到DLI表的作业时，如果遇到Parquet/Orc格式的OBS表对应的文件压缩率较高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.ma

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

</dependency> </dependencies> 图5 pom文件中添加配置在工程路径的“src > main > java”文件夹上鼠标右键，选择“New > Package”，新建Package和类文件。 Package根据需要定义，本示例定义为：“com.dli.demo”

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
导出SQL作业结果 - 数据湖探索 DLI

覆盖指定路径：当计划导出某一个结果时，您可以选择一个已有的文件路径作为输出目录，如果这个路径下已有同名文件，将会自动覆盖这个文件，即原有的作业结果会被新导出的作业结果文件所替代。覆盖指定路径方式适用于在同一个路径下保存唯一的作业结果文件的场景，即不需要旧的作业结果的场景。结果条数否

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

BY子句之前运行。调用窗口函数需要使用OVER子句来指定窗口的特殊语法。窗口具有三个组成部分：分区规范，它将输入行分为不同的分区。这类似于GROUP BY子句如何将行分为聚合函数的不同组。排序规范，它确定窗口函数将处理输入行的顺序。窗口框架，指定给定行该功能要处理的行的滑动窗口。如果未指定帧，则默认为“RANGE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

如果遇到提示SMN主题不存在您可以按照以下步骤进行排查：确认SMN主题是否已经创建。如果未创建，请在SMN服务管理控制台创建一个新的主题。如何自定义SMN主题，请参见《消息通知服务用户指南》中“创建主题”章节。检查IAM权限。如果SMN主题已经存在，但仍然提示不存在，请进入统

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
Flink作业常用操作 - 数据湖探索 DLI

选择需导入的作业配置文件的完整OBS路径。单击“下一步”。配置同名作业策略。单击“下一步”。勾选“配置同名替换”，如果待导入的作业名已存在，则覆盖已存在的作业配置，并且作业状态重置为草稿。不勾选“配置同名替换”，如果待导入的作业名已存在，则不导入同名作业的配置。确认“配置文件”和“同

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

请参考CSS安全集群配置，准备工作的主要目的是为了生成keystore.jks文件和truststore.jks文件，并将其上传至OBS桶中。开发说明-https off 如果没有开启https访问的话，不需要去生成keystore.jks和truststore.jks文件的，只需要设置好ssl访问和账号密码参数即可。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

SDK概述下载样例代码。 kind：资源包类型，当前支持包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
配置多版本过期数据回收站 - 数据湖探索 DLI

可以参考使用Hive语法创建OBS表。回收站数据自动清理需要在OBS并行文件系统的桶上配置回收站数据的生命周期规则。具体步骤参考如下：在OBS服务控制台页面左侧选择“并行文件系统”，单击对应的文件系统名称。在“基础配置”下单击“生命周期规则”，创建或者编辑生命周期规则。图1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

区版本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者Sbt构建工具中将scope设为provided 日志配置文件（例如l：“log4j.properties”或者“logback.xml”等）日志

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
DLI资源配额类 - 数据湖探索 DLI

DLI资源配额类什么是用户配额？怎样查看我的配额如何申请扩大配额

 帮助中心 > 数据湖探索 DLI > 常见问题
复杂数据类型 - 数据湖探索 DLI

使用限制创建含有复杂数据类型字段的表时，该表存储格式不支持CSV（txt）。如果表中含有复杂数据类型字段时，该表不支持CSV（txt）格式的文件数据导入。 MAP数据类型建表必须指定schema，且不支持date、short、timestamp数据类型。对于JSON格式OBS表，MAP的键类型只支持STRING类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

单击所建桶“obs1”，进入“对象”页面。勾选左侧列表中的“对象”，选择“上传对象”，将需要上传的文件“sampledata.csv”上传到指定目录，单击“上传”。 “sampledata.csv”样例文件可以通过新建“sampledata.txt”，复制如下英文逗号分隔的文本内容，再另存为“sampledata

帮助中心 > 数据湖探索 DLI > 快速入门
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告公告说明为了更好的实现资源共享，提高计算资源利用率，DLI将“包年/包月”和“按需计费”计费模式队列升级为“弹性资源池队列”。即使用DLI计算资源需先购买弹性资源池，并在弹性资源池中创建队列。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

OBS桶文件配置 OBS控制台如果是创建OBS表，则需要上传文件数据到OBS桶下。配置Spark创建表的元数据信息的存储路径。该文件夹路径用来存储Spark创建表的元数据信息“spark.sql.warehouse.dir”。 3 新建Maven工程，配置pom文件 IntelliJ

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南

总条数： 541

上一页
1
...
18
19
20
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导入数据 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

DLI资源配额类 - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线