搜索_华为云

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.partitions参数值来解决缓冲区不足问题。具体该参数设置步骤如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

Hive 3.x 使用 UTC 时区。数据类型映射目前，Parquet 格式类型映射与 Apache Hive 兼容，但与 Apache Spark 有所不同： Timestamp：不论精度，映射 timestamp 类型至 int96。 Decimal：根据精度，映射 decimal

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
DLI Delta常见问题 - 数据湖探索 DLI

partitioned table `777dd`.`test_delta_parts1` 解决方案：在console页面设置中添加参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled值为false。 show

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ Spark中没有datetime数据类型，其使用的是TIMESTAMP类型。您可以通过函数进行转换。例如： select cast(create_date as string)

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
实时任务接入 - 数据湖探索 DLI

实时任务接入实时作业一般由Flink Sql或Sparkstreaming来完成，流式实时任务通常配置同步生成compaction计划，异步执行计划。 Flink SQL作业中sink端Hudi表相关配置如下： create table hudi_sink_table ( //

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
创建Bucket索引表调优 - 数据湖探索 DLI

创建Bucket索引表调优创建Bucket索引表调优 Bucket索引常用设置参数： Spark： hoodie.index.type=BUCKET hoodie.bucket.index.num.buckets=5 Flink index.type=BUCKET hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi Clean操作说明 - 数据湖探索 DLI

写完数据后clean Spark SQL（设置如下参数，随后执行任意写入SQL时，在满足条件时触发） hoodie.clean.automatic=true hoodie.cleaner.commits.retained=10 // 默认值为10，根据业务场景指定 SparkDataSou

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled为false。命令格式 OPTIMIZE

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

= { val spark = SparkSession .builder() .enableHiveSupport() .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
权限管理概述 - 数据湖探索 DLI

用户行为分析，辅助决策。如图1所示，“基础平台组组长”在华为云上申请了一个“租户管理员”（Tenant Administrator）账号，用于管理和使用华为云的各个服务。因为“大数据平台组”需要使用DLI进行数据分析，所有“基础平台组组长”增加了一个权限为“DLI服务管理员”（DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
DLI常用跨源分析开发方式 - 数据湖探索 DLI

跨源分析语法参考服务名称开发SQL作业开发Spark jar作业开发Flink OpenSource SQL作业开发Flink Jar作业 CloudTable HBase 创建HBase关联表插入数据查询数据 scala样例代码 pyspark样例代码 java样例代码 Hbase源表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
查询作业执行进度信息 - 数据湖探索 DLI

Integer 子作业ID，对应开源spark JobData的jobId。 name 否 String 子作业name，对应开源spark JobData的name。 description 否 String 子作业description，对应开源spark JobData的description。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
版本支持公告 - 数据湖探索 DLI

DLI计算引擎版本生命周期 Flink 1.15版本说明 Flink 1.12版本说明 Spark 3.3.1版本说明 Spark 3.1.1版本说明 Spark 2.4.5版本说明 Spark 2.4.x与Spark 3.3.x版本差异对比

 帮助中心 > 数据湖探索 DLI > 服务公告
DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI支持如下数据格式： Parquet CSV ORC Json Avro DLI服务的数据可以存储在哪些地方？ OBS：SQL作业，Spark作业，Flink作业使用的数据均可以存储在OBS服务中，降低存储成本。 DLI：DLI内部使用的是列存的Parquet格式，即数据以Parquet格式存储。存储成本较高。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

在SQL编辑器界面，单击“设置”，在“配置项”尝试添加以下几个Spark参数进行解决。参数项如下，冒号前是配置项，冒号后是配置项的值。 spark.sql.enableToString:false spark.sql.adaptive.join.enabled:true spark.sql.adaptive.enabled:true

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
DLI SDK功能矩阵 - 数据湖探索 DLI

Flink作业相关介绍新建Flink作业、查询作业详情、查询作业列表等Java SDK使用说明。 Spark作业相关介绍提交Spark作业、查询所有Spark作业、删除Spark作业等Java SDK使用说明。 Flink作业模板相关介绍新建Flink作业模板、更新Flink

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
SQL作业开发指南 - 数据湖探索 DLI

SQL作业开发指南使用Spark SQL作业分析OBS数据在DataArts Studio开发DLI SQL作业在Spark SQL作业中使用UDF 在Spark SQL作业中使用UDTF 在Spark SQL作业中使用UDAF

帮助中心 > 数据湖探索 DLI > 开发指南

总条数： 654

上一页
1
...
26
27
28
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

DLI Delta常见问题 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

版本支持公告 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

SQL作业开发指南 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线