搜索_华为云

为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？ - MapReduce服务 MRS

为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？问题为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？回答 Spark SQL对

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
运行Spark Streaming任务参数调优的注意事项 - MapReduce服务 MRS

运行Spark Streaming任务参数调优的注意事项问题运行Spark Streaming任务时，随着executor个数的增长，数据处理性能没有明显提升，对于参数调优有哪些注意事项？回答在executor核数等于1的情况下，遵循以下规则对调优Spark Streaming运行参数有所帮助。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Streaming
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 开发HDFS应用
Impala应用开发常用概念 - MapReduce服务 MRS

Impala应用开发常用概念客户端客户端直接面向用户，可通过Java API、Thrift API访问服务端进行Impala的相关操作。本文中的Impala客户端特指Impala client的安装目录，里面包含通过Java API访问Impala的样例代码。 HiveQL语言

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > Impala应用开发概述
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 开发HDFS应用
批量构建HBase全局二级索引数据 - MapReduce服务 MRS

批量构建HBase全局二级索引数据场景介绍在用户的表中预先存在大量数据的情况下，可基于MapReaduce任务，批量构建已有数据的索引数据。批量构建全局二级索引数据只有处于INACTIVE状态的索引才能进行批量构建，如需重建索引数据，请先修改索引状态。数据表中存在大量数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase全局二级索引提升查询效率
二进制函数和运算符 - MapReduce服务 MRS

二进制函数和运算符二进制运算符 || 运算符执行连接。二进制函数 length(binary) → bigint 返回binary的字节长度。 select length(x'00141f');-- 3 concat(binary1, ..., binaryN) → varbinary

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
如何处理blob.storage.directory配置/home目录时启动yarn-session失败 - MapReduce服务 MRS

如何处理blob.storage.directory配置/home目录时启动yarn-session失败问题当用户设置“blob.storage.directory”为“/home”时，用户没有权限在“/home”下创建“blobStore-UUID”的文件，导致yarn-session启动失败。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > Flink应用开发常见问题
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
使用CDM服务迁移数据至MRS HDFS时任务运行失败 - MapReduce服务 MRS

使用CDM服务迁移数据至MRS HDFS时任务运行失败用户问题使用CDM从旧的集群迁移数据至新集群的HDFS过程失败。问题现象使用CDM从源HDFS导入目的端HDFS，发现目的端MRS集群故障，NameNode无法启动。查看日志发现在启动过程中存在“Java heap

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
MapReduce样例工程介绍 - MapReduce服务 MRS

MapReduce样例工程介绍 MRS样例工程获取地址为https://github.com/huaweicloud/huaweicloud-mrs-example，切换分支为与MRS集群相匹配的版本分支，然后下载压缩包到本地后解压，即可获取各组件对应的样例代码工程。当前MRS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式）
运行Spark Streaming任务参数调优的注意事项 - MapReduce服务 MRS

运行Spark Streaming任务参数调优的注意事项问题运行Spark Streaming任务时，随着executor个数的增长，数据处理性能没有明显提升，对于参数调优有哪些注意事项？回答在executor核数等于1的情况下，遵循以下规则对调优Spark Streaming运行参数有所帮助。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Streaming
EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败问题在JournalNode节点有断电，数据目录磁盘占满，网络异常时，会导致JournalNode上的EditLog不连续。此时如果重启NameNode，很可能会失败。现象重启NameNode会失败。在NameNode运行日志中会报如下的错误：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS故障排除
Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化操作场景优化Group by语句，可提升命令执行速度和查询速度。 Group by的时候， Map端会先进行分组，分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合，减少Map的输出数据量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Hudi数据表Compaction规范 - MapReduce服务 MRS

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
Flink作业参数规则 - MapReduce服务 MRS

Flink作业参数规则 Flink作业参数配置规范 Flink作业参数配置规范如下表所示。表1 Flink作业参数配置规范参数名称是否必填参数描述建议值 -c 必填指定主类名。根据实际情况而定 -ynm 必填 Flink Yarn作业名称。根据实际情况而定 execution

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范 > Flink作业参数规范
调整Hive元数据超时 - MapReduce服务 MRS

调整Hive元数据超时大分区表包含过多分区，导致任务超时，同时大量分区可能需要更多时间来加载与元存储缓存同步。因此，为了在更大规模存储中获得更好的性能，建议相应地调整加载元数据缓存最大超时时间和加载元数据连接池最大等待时间。使用HetuEngine管理员用户登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败问题在JournalNode节点有断电，数据目录磁盘占满，网络异常时，会导致JournalNode上的EditLog不连续。此时如果重启NameNode，很可能会失败。现象重启NameNode会失败。在NameNode运行日志中会报如下的错误：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS故障排除
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？问题背景使用SparkSql访问Hive的一个数据存放于OBS的一个分区表，但是运行速度却很慢，并且会大量调用OBS的查询接口。 SQL样例： select a,b,c from test where b=xxx

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类

总条数： 5298

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？ - MapReduce服务 MRS

运行Spark Streaming任务参数调优的注意事项 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

Impala应用开发常用概念 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

批量构建HBase全局二级索引数据 - MapReduce服务 MRS

二进制函数和运算符 - MapReduce服务 MRS

如何处理blob.storage.directory配置/home目录时启动yarn-session失败 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

使用CDM服务迁移数据至MRS HDFS时任务运行失败 - MapReduce服务 MRS

MapReduce样例工程介绍 - MapReduce服务 MRS

运行Spark Streaming任务参数调优的注意事项 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

Hudi数据表Compaction规范 - MapReduce服务 MRS

Flink作业参数规则 - MapReduce服务 MRS

调整Hive元数据超时 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线