搜索_华为云

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南概述 DLI提供了使用自定义Jar运行Flink作业并将数据写入到OBS的能力。本章节JAVA样例代码演示将kafka数据处理后写入到OBS，具体参数配置请根据实际环境修改。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
创建并使用跨源链接 - 数据湖探索 DLI

"ip":"192.168.0.1", "name":"ecs-97f8-0001" }, { "ip":"192.168.0.2", "name":"ecs-97f8-0002" } ] } 响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

output_format_classname partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression row_format

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
更新表分区信息（只支持OBS表） - 数据湖探索 DLI

SERDEPROPERTIES：Serde属性。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path OBS存储路径。注意事项该命令的主要应用场景是针对分区表，如当手动在OBS上面添加分区目录时，再通过上

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

都会出现。 sink.partitioner 否 'default' String Flink partition 到 Kafka partition 的分区映射关系，可选值有： default：使用 Kafka 默认的分区器对消息进行分区。 fixed：每个 Flink partition

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

multimap_agg(key, value) -> map(K, array(V)) 描述：返回一个由输入key、value键值对组成的多重映射map。每个key可以对应多个value。 select multimap_agg(key, value) from (values ('apple'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size 问题描述在Spark SQL作业中，使用LOAD DATA命令导入数据到DLI表中时报如下错误： error.DLI.0001: Illeg

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x版本中使用Mesos作为资源管理器，升级到Spark 3.3.x后，你需要考虑切换到其他资源管理器。 Spark3.3.x会在应用程序自行终止时删除K8s driver 说明：Spark3.3.x会在应用程序自行终止时删除K8s driver。升级引擎版本后是否对作业有影响：功能增强，升级到Spark 3

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？问题现象使用DLI插入数据到OBS临时表文件，数据量有差异。根因分析出现该问题可能原因如下：作业执行过程中，读取数据量错误。验证数据量的方式不正确。通常在执行插入数据操作后，如需确认插入数据量是否正确，建议通过查询语句进行查询。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

单引号（''）包围起来。 partition_specs 分区信息，key=value形式，key为分区字段，value为分区值。若分区字段为多个字段，可以不包含所有的字段，会删除匹配上的所有分区。“partition_specs”中的参数默认带有“( )”，例如：PARTITION

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

系统无法保证按计划扩容/缩容至目标CUs：弹性资源池扩容时，可能会由于物理资源不足导致弹性资源池无法扩容到设定的目标大小。弹性资源池缩容时，系统不保证将队列资源完全缩容到设定的目标大小。在执行缩容任务时，系统会先检查资源使用情况，判断是否存在缩容空间，如果现有资源无法按照最

 帮助中心 > 数据湖探索 DLI > 产品介绍
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？问题现象手动在OBS表的分区目录下上传了分区数据，但是在SQL编辑器中查询该表新增的分区数据时却查询不到。解决方案手动添加分区数据后，需要刷新OBS表的元数据信息。具体操作如下： MSCK REPAIR TABLE

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

方案架构将CSV格式的数据上传到对象存储服务OBS，使用DLI将CSV数据转换为Parquet数据，并将转换后的Parquet数据存储到OBS中。图1 方案简介流程指导使用DLI将CSV数据转换为Parquet数据主要包括以下步骤：步骤1：创建并上传数据。将数据上传到对象存储服务OBS。

帮助中心 > 数据湖探索 DLI > 最佳实践
将OBS数据导入至DLI - 数据湖探索 DLI

将OBS数据导入至DLI 本节操作介绍将OBS上的数据导入到DLI控制台的表中。注意事项导入数据时只能指定一个路径，路径中不能包含逗号。如果将CSV格式数据导入分区表，需在数据源中将分区列放在最后一列。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

准备工作已注册华为账号并开通华为云，且在使用DLI前检查账号状态，账号不能处于欠费或冻结状态。配置DLI委托访问授权 DLI使用过程中涉及到OBS、VPC、SMN等服务交互，首次使用DLI需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录DLI管理控制台，在左侧导航栏单击“全局配置

 帮助中心 > 数据湖探索 DLI > 快速入门
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

autoBroadcastJoinThreshold=-1，具体操作如下：登录DLI管理控制台，单击“作业管理 > SQL作业”，在对应报错作业的“操作”列，单击“编辑”进入到SQL编辑器页面。单击“设置”，在参数设置中选择“spark.sql.autoBroadcastJoinThreshold”参数，其值设置为“-1”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

OVERWRITE命令只有在分区表下不同的插入到不同静态分区才可以并行。 INSERT INTO命令和INSERT OVERWRITE命令同时执行，其结果是未知的。在从源表插入数据到目标表的过程中，无法在源表中导入或更新数据。对于Hive分区表的动态INSERT OVERWRITE，支持覆盖涉及到的分区数据，不支持覆盖整表数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
RESTORE - 数据湖探索 DLI
RESTORE - 数据湖探索 DLI

RESTORE 命令功能 RESTORE命令用于将Delta表还原到早期状态，支持还原到较早的版本号或者时间戳。命令格式还原Delta表到历史某一时刻的状态： RESTORE [TABLE] [database_name.]table_name|DELTA.`obs_path`

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过20分钟且只剩余一个task在运行，即为数据倾斜的情况。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类

总条数： 338

上一页
1
...
10
11
12
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

标示符 - 数据湖探索 DLI

更新表分区信息（只支持OBS表） - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

RESTORE - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线