搜索_华为云

Spark SQL样例程序开发思路 - MapReduce服务 MRS

Spark SQL样例程序开发思路场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程操作场景 Spark针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Spark工程。针对Java和Scala不同语言的工程，其导入方式相同。使用Python开发的样例工程不需要导入，直接打开Python文件（*

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Compaction - MapReduce服务 MRS
Compaction - MapReduce服务 MRS

Compaction 本章节仅适用于MRS 3.3.0及之后版本。命令功能对Hudi表进行compaction操作，具体作用可以参考Hudi Compaction操作说明章节。命令格式 call run_compaction(op => '[op]', table=>'[table]'

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 开发HDFS应用
MRS集群补丁说明 - MapReduce服务 MRS

MRS集群补丁说明 EulerOS补丁说明 MRS 3.3.1-LTS.1.2补丁说明 MRS 3.3.1-LTS.1.1补丁说明 MRS 3.3.0-LTS.1.1补丁说明 MRS 3.3.0.3.1补丁说明 MRS 3.2.0-LTS.1.10补丁说明 MRS 3.2.0-LTS

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维
批量构建HBase全局二级索引数据 - MapReduce服务 MRS

批量构建HBase全局二级索引数据场景介绍在用户的表中预先存在大量数据的情况下，可基于MapReaduce任务，批量构建已有数据的索引数据。批量构建全局二级索引数据只有处于INACTIVE状态的索引才能进行批量构建，如需重建索引数据，请先修改索引状态。数据表中存在大量数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase全局二级索引提升查询效率
运行Spark Streaming任务参数调优的注意事项 - MapReduce服务 MRS

运行Spark Streaming任务参数调优的注意事项问题运行Spark Streaming任务时，随着executor个数的增长，数据处理性能没有明显提升，对于参数调优有哪些注意事项？回答在executor核数等于1的情况下，遵循以下规则对调优Spark Streaming运行参数有所帮助。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Streaming
MapReduce样例工程介绍 - MapReduce服务 MRS

MapReduce样例工程介绍 MRS样例工程获取地址为https://github.com/huaweicloud/huaweicloud-mrs-example，切换分支为与MRS集群相匹配的版本分支，然后下载压缩包到本地后解压，即可获取各组件对应的样例代码工程。当前MRS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式）
为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？ - MapReduce服务 MRS

为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？问题为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？回答 Spark SQL对

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
配置Yarn数据访问通道协议 - MapReduce服务 MRS

配置Yarn数据访问通道协议配置场景服务端配置了web访问为https通道，如果客户端没有配置，默认使用http访问，客户端和服务端的配置不同，就会导致访问结果显示乱码。在客户端和服务端配置相同的“yarn.http.policy”参数，可以防止客户端访问结果显示乱码。操作步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn企业级能力增强
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式） > 开发HDFS应用
配置Yarn数据访问通道协议 - MapReduce服务 MRS

配置Yarn数据访问通道协议配置场景服务端配置了web访问为https通道，如果客户端没有配置，默认使用http访问，客户端和服务端的配置不同，就会导致访问结果显示乱码。在客户端和服务端配置相同的“yarn.http.policy”参数，可以防止客户端访问结果显示乱码。操作步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn企业级能力增强
Hudi数据表Compaction规范 - MapReduce服务 MRS

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
配置Hive Python3样例工程 - MapReduce服务 MRS

配置Hive Python3样例工程操作场景为了运行MRS产品Hive组件的Python3接口样例代码，需要完成下面的操作。操作步骤客户端机器必须安装有Python3，其版本不低于3.6，最高不能超过3.8。在客户端机器的命令行终端输入python3可查看Python版本号。如下显示Python版本为3

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
调整Hive元数据超时 - MapReduce服务 MRS

调整Hive元数据超时大分区表包含过多分区，导致任务超时，同时大量分区可能需要更多时间来加载与元存储缓存同步。因此，为了在更大规模存储中获得更好的性能，建议相应地调整加载元数据缓存最大超时时间和加载元数据连接池最大等待时间。使用HetuEngine管理员用户登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
二进制函数和运算符 - MapReduce服务 MRS

二进制函数和运算符二进制运算符 || 运算符执行连接。二进制函数 length(binary) → bigint 返回binary的字节长度。 select length(x'00141f');-- 3 concat(binary1, ..., binaryN) → varbinary

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
配置Hive Python3样例工程 - MapReduce服务 MRS

配置Hive Python3样例工程操作场景为了运行MRS产品Hive组件的Python3接口样例代码，需要完成下面的操作。操作步骤客户端机器必须安装有Python3，其版本不低于3.6，最高不能超过3.8。在客户端机器的命令行终端输入python3可查看Python版本号。如下显示Python版本为3

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程

总条数： 5463

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL样例程序开发思路 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

Compaction - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

MRS集群补丁说明 - MapReduce服务 MRS

批量构建HBase全局二级索引数据 - MapReduce服务 MRS

运行Spark Streaming任务参数调优的注意事项 - MapReduce服务 MRS

MapReduce样例工程介绍 - MapReduce服务 MRS

为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？ - MapReduce服务 MRS

配置Yarn数据访问通道协议 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

配置Yarn数据访问通道协议 - MapReduce服务 MRS

Hudi数据表Compaction规范 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

配置Hive Python3样例工程 - MapReduce服务 MRS

调整Hive元数据超时 - MapReduce服务 MRS

二进制函数和运算符 - MapReduce服务 MRS

配置Hive Python3样例工程 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线