搜索_华为云

创建HDFS目录 - MapReduce服务 MRS
创建HDFS目录 - MapReduce服务 MRS

创建HDFS目录功能简介创建目录过程为：调用FileSystem实例的exists方法查看该目录是否存在。如果存在，则直接返回。如果不存在，则调用FileSystem实例的mkdirs方法创建该目录。代码样例如下是写文件的代码片段，详细代码请参考com.huawei.bigdata.hdfs.examples

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 开发HDFS应用
写入更新数据时报错Parquet/Avro schema - MapReduce服务 MRS

写入更新数据时报错Parquet/Avro schema 问题数据写入时报错： org.apache.parquet.io.InvalidRecordException: Parquet/Avro schema mismatch: Avro field 'col1' not found

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi常见问题
HDFS常见问题 - MapReduce服务 MRS
HDFS常见问题 - MapReduce服务 MRS

HDFS常见问题执行distcp命令报错如何处理 HDFS执行Balance时被异常停止如何处理访问HDFS WebUI时，界面提示无法显示此页 HDFS WebUI无法正常刷新损坏数据的信息 NameNode节点长时间满负载导致客户端无响应为什么主NameNode重启后系统出现双备现象

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
为什么已备份的Hive表无法执行drop操作 - MapReduce服务 MRS

为什么已备份的Hive表无法执行drop操作问题为什么已备份的Hive表执行drop操作会失败？回答由于已备份Hive表对应的HDFS目录创建了快照，导致HDFS目录无法删除，造成Hive表删除失败。 Hive表在执行备份操作时，会创建表对应的HDFS数据目录快照。而HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
Impala应用开发常用概念 - MapReduce服务 MRS

Impala应用开发常用概念客户端客户端直接面向用户，可通过Java API、Thrift API访问服务端进行Impala的相关操作。本文中的Impala客户端特指Impala client的安装目录，里面包含通过Java API访问Impala的样例代码。 HiveQL语言

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > Impala应用开发概述
MapReduce应用开发简介 - MapReduce服务 MRS

MapReduce应用开发简介 MapReduce简介 Hadoop MapReduce是一个使用简易的并行计算软件框架，基于它写出来的应用程序能够运行在由上千个服务器组成的大型集群上，并以一种可靠容错的方式并行处理上T级别的数据集。一个MapReduce作业（application

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式）
通过Hue管理Oozie作业 - MapReduce服务 MRS

通过Hue管理Oozie作业操作场景用户需要使用图形化界面查看集群中所有作业时，可以通过Hue完成任务。 Hue提供了Oozie作业管理器功能，使用户可以通过界面图形化的方式使用Oozie。 Hue界面主要用于文件、表等数据的查看与分析，禁止通过Hue界面对操作对象进行删除等高危管理操作

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue > 创建Hue操作任务
开启/关闭TTL - MapReduce服务 MRS
开启/关闭TTL - MapReduce服务 MRS

开启/关闭TTL 命令功能开启或者关闭Hudi表的TTL能力。命令格式 call ttl_configuration(table => "[table]", path => "[path]", enabled => "[enabled]", strategy => "[strategy

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > HudiTTL语法说明
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Compaction - MapReduce服务 MRS
Compaction - MapReduce服务 MRS

Compaction 本章节仅适用于MRS 3.3.0及之后版本。命令功能对Hudi表进行compaction操作，具体作用可以参考Hudi Compaction操作说明章节。命令格式 call run_compaction(op => '[op]', table=>'[table

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
MapReduce应用开发简介 - MapReduce服务 MRS

MapReduce应用开发简介 MapReduce简介 Hadoop MapReduce是一个使用简易的并行计算软件框架，基于它写出来的应用程序能够运行在由上千个服务器组成的大型集群上，并以一种可靠容错的方式并行处理上T级别的数据集。一个MapReduce作业（application

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（普通模式）
MapReduce应用开发简介 - MapReduce服务 MRS

MapReduce应用开发简介 MapReduce简介 Hadoop MapReduce是一个使用简易的并行计算软件框架，基于它写出来的应用程序能够运行在由上千个服务器组成的大型集群上，并以一种可靠容错的方式并行处理上TB级别的数据集。一个MapReduce作业（application

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式）
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
配置SparkSQL的分块个数 - MapReduce服务 MRS

配置SparkSQL的分块个数配置场景 SparkSQL在进行shuffle操作时默认的分块数为200。在数据量特别大的场景下，使用默认的分块数就会造成单个数据块过大。如果一个任务产生的单个shuffle数据块大于2G，该数据块在被fetch的时候还会报类似错误： Adjusted

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
使用Hue提交Oozie Java作业 - MapReduce服务 MRS

使用Hue提交Oozie Java作业操作场景该任务指导用户通过Hue界面提交Java类型的Oozie作业。操作步骤创建工作流，请参考使用Hue创建工作流。在工作流编辑页面，选择“Java 程序”按钮，将其拖到操作区中。在弹出的“Java program”窗口中配置“Jar

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Hue提交Oozie作业
创建HDFS文件并写入内容 - MapReduce服务 MRS

创建HDFS文件并写入内容功能简介写文件过程为：使用FileSystem实例的create方法获取写文件的输出流。使用该输出流将内容写入到HDFS的指定文件中。在写完文件后，需关闭所申请资源。代码样例如下是写文件的代码片段，详细代码请参考com.huawei.bigdata.hdfs.examples

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
Spark增量读取Hudi参数规范 - MapReduce服务 MRS

Spark增量读取Hudi参数规范规则增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例 set hoodie.tableName.consume.mode=INCREMENTAL

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
组件WebUI便捷访问 - MapReduce服务 MRS

组件WebUI便捷访问大数据组件都有自己的WebUI页面管理自身系统，但是由于网络隔离的原因，用户并不能很简便地访问到该页面。例如访问HDFS的WebUI页面，传统的操作方法是需要用户创建ECS，使用ECS远程登录组件的UI，这使得组件的页面UI访问很是繁琐，对于很多初次接触大数据的用户很不友好

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame

总条数： 5435

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建HDFS目录 - MapReduce服务 MRS

写入更新数据时报错Parquet/Avro schema - MapReduce服务 MRS

HDFS常见问题 - MapReduce服务 MRS

为什么已备份的Hive表无法执行drop操作 - MapReduce服务 MRS

Impala应用开发常用概念 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

通过Hue管理Oozie作业 - MapReduce服务 MRS

开启/关闭TTL - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

Compaction - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

使用Hue提交Oozie Java作业 - MapReduce服务 MRS

创建HDFS文件并写入内容 - MapReduce服务 MRS

Spark增量读取Hudi参数规范 - MapReduce服务 MRS

组件WebUI便捷访问 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线