搜索_华为云

Spark SQL样例程序（Scala） - MapReduce服务 MRS

Spark SQL样例程序（Scala）功能简介统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection： object

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
Spark SQL样例程序（Scala） - MapReduce服务 MRS

Spark SQL样例程序（Scala）功能简介统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection： object

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
MRS是否支持同时运行多个Flume任务？ - MapReduce服务 MRS

MRS是否支持同时运行多个Flume任务？ Flume客户端可以包含多个独立的数据流，即在一个配置文件properties.properties中配置多个Source、Channel、Sink。这些组件可以链接以形成多个数据流。例如在一个配置中配置两个数据流，示例如下： server

帮助中心 > MapReduce服务 MRS > 常见问题 > 组件配置类
计费模式概述 - MapReduce服务 MRS

MRS当前支持包年/包月和按需计费模式，以满足不同场景下的用户需求。包年/包月：根据集群购买时长，一次性支付集群费用。最短时长为1个月，最长时长为1年。按需计费：节点按实际使用时长计费，计费周期为一小时。表1列出了两种计费模式的区别。表1 计费模式计费模式包年/包月按需计费

 帮助中心 > MapReduce服务 MRS > 计费说明 > 计费模式
Kudu应用开发流程 - MapReduce服务 MRS

Kudu应用开发流程开发流程中各阶段的说明如图1和表1所示。图1 Kudu应用程序开发流程表1 Kudu应用开发的流程说明阶段说明参考文档了解基本概念在开始开发应用前，需要了解Kudu的基本概念。 Kudu应用开发常用概念准备开发和运行环境 Kudu的应用程序支持多种语言进行

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（安全模式） > Kudu应用开发概述
Hudi Clustering操作说明 - MapReduce服务 MRS

调度Clustering：使用可插拔的Clustering策略创建Clustering计划。识别符合Clustering条件的文件：根据所选的Clustering策略，调度逻辑将识别符合Clustering条件的文件。根据特定条件对符合Clustering条件的文件进行分组。每个组的数据大小应为t

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
Spark Core样例程序开发思路 - MapReduce服务 MRS

conf）。user.keytab和krb5.conf文件为安全模式下的认证文件，需要在FusionInsight Manager中下载principal用户的认证凭证，样例代码中使用的用户为：sparkuser，需要修改为准备好的开发用户。打包项目将user.keytab、krb5.conf

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Core样例程序
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

场景说明场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark SQL程序
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

场景说明场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下功能：实时统计连续网购时间超过半个小时的女性网民信息。周末两天的日志文件第一列为姓名，第二列为性别，第三列为本次停留时间，单位为分钟，分隔符为“,”。 log1

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming程序
准备本地应用开发环境 - MapReduce服务 MRS

IDEA中的JDK配置为Open JDK。不同的IntelliJ IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。准备开发用户参考准备MRS应用开发用户进行操作，准备用于应用开发的集群用户并授予相应权限。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（安全模式） > 准备Oozie应用开发环境
Oozie应用开发流程 - MapReduce服务 MRS

Oozie提供了不同场景下的样例程序，您可以导入样例工程进行程序学习。导入并配置Oozie样例工程准备安全认证如果您使用的是安全集群，需要进行安全认证。配置Oozie应用安全认证根据场景开发工程提供了Java语言的样例工程。开发Oozie应用编译并运行程序指导用户将开发好的程序编译并提交运行。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（安全模式） > Oozie应用开发概述
数据恢复 - MapReduce服务 MRS
数据恢复 - MapReduce服务 MRS

<export_from> 其中，各参数的含义如下： $Sqoop_Home：目的集群上Sqoop的安装目录。 <ip>：目的集群上数据库的IP地址。 <table_name>：待恢复的表名称。 <passwd>：hive用户的密码。 <export_from>：元数据在目的集群的HDFS地址。命令

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移 > 数据迁移方案介绍
配置Hive分区元数据冷热存储 - MapReduce服务 MRS

分区元数据冷热存储介绍为了减轻集群元数据库压力，将长时间未使用过的指定范围的分区相关元数据移动到备份表，这一过程称为分区数据冻结，冻结的分区数据称为冷分区，未冻结的分区称为热分区，存在冷分区的表称为冻结表。将被冻结的数据重新移回原元数据表中，这一过程称为分区数据解冻。一个分区从

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
HBase应用开发流程 - MapReduce服务 MRS

提供了Java语言的样例工程，包含从建表、写入到删除表全流程的样例工程。开发HBase应用编译并运行程序指导用户将开发好的程序编译并提交运行。调测HBase应用查看程序运行结果程序运行结果会写在用户指定的路径下。用户还可以通过UI查看应用运行情况。调测HBase应用父主题： HBase开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式）
HBase应用开发流程介绍 - MapReduce服务 MRS

根据场景开发工程提供了Java语言的样例工程，包含从建表、写入到删除表全流程的样例工程。开发HBase应用编译并运行程序指导用户将开发好的程序编译并提交运行。调测HBase应用查看程序运行结果程序运行结果会写在用户指定的路径下。用户还可以通过UI查看应用运行情况。父主题：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式）
在Linux中调测Presto应用开发 - MapReduce服务 MRS

码中conf目录下的presto.preperties。未开启Kerberos认证集群无须执行此步骤。表1 presto.preperties参数说明参数说明 user 用于Kerberos认证的用户名，即准备Presto应用开发用户中创建的开发用户的用户名。 KerberosPrincipal

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > 调测Presto应用
Hive应用开发建议 - MapReduce服务 MRS

jar，和重新定义UDF。 Hive的UDF会有一些默认属性，比如“deterministic”默认为“true”（同一个输入会返回同一个结果），“stateful”（是否有状态，默认为“true”）。当用户实现的自定义UDF内部实现了汇总等，需要在类上加上相应的注解，例如如下类： @UDFType(deterministic

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hive应用开发规范
手动将CSV离线数据导入至IoTDB - MapReduce服务 MRS

图2展示了使用IoTDB套件的全部组件形成的整体应用架构，IoTDB特指其中的时间序列数据库组件。图2 IoTDB结构用户可以通过JDBC/Session将来自设备传感器上采集的时序数据和服务器负载、CPU内存等系统状态数据、消息队列中的时序数据、应用程序的时序数据或者其他数据库中的时序数据导

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 物联网时序数据分析
配置MapReduce集群管理员列表 - MapReduce服务 MRS

是否开启对Job History Server权限控制的开关。 true mapreduce.cluster.administrators 用于指定MapReduce集群管理员列表，可以配置用户和用户组，用户或者用户组之间用逗号间隔，用户和用户组之间用空格间隔，举例：userA,userB

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce
Spark Core内存调优 - MapReduce服务 MRS

加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优

总条数： 3471

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL样例程序（Scala） - MapReduce服务 MRS

Spark SQL样例程序（Scala） - MapReduce服务 MRS

MRS是否支持同时运行多个Flume任务？ - MapReduce服务 MRS

计费模式概述 - MapReduce服务 MRS

Kudu应用开发流程 - MapReduce服务 MRS

Hudi Clustering操作说明 - MapReduce服务 MRS

Spark Core样例程序开发思路 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

Oozie应用开发流程 - MapReduce服务 MRS

数据恢复 - MapReduce服务 MRS

配置Hive分区元数据冷热存储 - MapReduce服务 MRS

HBase应用开发流程 - MapReduce服务 MRS

HBase应用开发流程介绍 - MapReduce服务 MRS

在Linux中调测Presto应用开发 - MapReduce服务 MRS

Hive应用开发建议 - MapReduce服务 MRS

手动将CSV离线数据导入至IoTDB - MapReduce服务 MRS

配置MapReduce集群管理员列表 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线