搜索_华为云

在Linux环境中编包并运行Spark程序 - MapReduce服务 MRS

环境中运行应用。使用Scala或Java语言开发的应用程序在Spark客户端的运行步骤是一样的。使用Python开发的Spark应用程序无需打包成jar，只需将样例工程复制到编译机器上即可。用户需保证worker和driver的Python版本一致，否则将报错："Python

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 调测Spark应用 > 在Linux环境中调测Spark应用
作业管理类 - MapReduce服务 MRS
作业管理类 - MapReduce服务 MRS

作业管理类 MRS集群支持提交哪些形式的Spark作业？ MRS节点访问OBS报错408如何处理？如何让不同的业务程序分别用不同的Yarn队列？提交作业失败，报错与OBS相关如何处理？ MRS集群租户资源最小值为0时只能同时运行一个任务吗？作业提交参数间用空格隔开导致参数信息不被识别如何处理？

帮助中心 > MapReduce服务 MRS > 常见问题
在Linux环境中编包并运行Spark程序 - MapReduce服务 MRS

环境中运行应用。使用Scala或Java语言开发的应用程序在Spark客户端的运行步骤是一样的。使用Python开发的Spark应用程序无需打包成jar，只需将样例工程复制到编译机器上即可。用户需保证worker和driver的Python版本一致，否则将报错："Python

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 调测Spark应用 > 在Linux环境中调测Spark应用
Hive常见日志说明 - MapReduce服务 MRS

者MetaStore的请求以及记录执行的语句是什么。如下的HiveServer审计日志，表示在2016-02-01 14:51:22 用户user_chen向HiveServer发起了show tables请求，客户端IP为192.168.1.18。如下的MetaStore审计日志，表示在2016-01-29

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

长时间运行的集群会因为曾经删除过大量的文件，或者集群中的节点做磁盘扩容等操作导致节点上出现磁盘间数据不均衡的现象。磁盘间数据不均衡会引起HDFS整体并发读写性能的下降或者因为不恰当的HDFS写策略导致业务故障。此时需要平衡节点磁盘间的数据密度，防止异构的小磁盘成为该节点的性能瓶颈。本章节适用于MRS 3

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
Storm业务拓扑配置GC参数不生效 - MapReduce服务 MRS

如果配置了topology.worker.gc.childopts则服务端参数worker.gc.childopts会被替换。解决办法如果想要修改拓扑的JVM参数，可以在命令中直接修改topology.worker.gc.childopts这个参数或者在服务端修改该参数，当topology.worker

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
准备Impala开发和运行环境 - MapReduce服务 MRS

IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。 7-zip 用于解压“*.zip”和“*.rar”文件，支持7-zip 16.04版本。准备运行环境进行应用开发时，需要同时准备代码的运行调测的环境，用于验证应用程序运行正常。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 准备Impala应用开发环境
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

长时间运行的集群会因为曾经删除过大量的文件，或者集群中的节点做磁盘扩容等操作导致节点上出现磁盘间数据不均衡的现象。磁盘间数据不均衡会引起HDFS整体并发读写性能的下降或者因为不恰当的HDFS写策略导致业务故障。此时需要平衡节点磁盘间的数据密度，防止异构的小磁盘成为该节点的性能瓶颈。本章节适用于MRS 3

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
ClickHouse数据查询 - MapReduce服务 MRS

题。数据修改建议慎用delete、update的mutation操作标准SQL的更新、删除操作是同步的，即客户端要等服务端返回执行结果（通常是int值）；而ClickHouse的update、delete是通过异步方式实现的，当执行update语句时，服务端立即返回执行成功

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库开发
配置HDFS用户访问HDFS文件权限 - MapReduce服务 MRS

/user/mapred:755 配置HDFS文件和目录的权限 HDFS支持用户进行文件和目录默认权限的修改。HDFS默认用户创建文件和目录的权限的掩码为“022”，如果默认权限满足不了用户的需求，可以通过配置项进行默认权限的修改。参数入口：请参考修改集群服务配置参数，进入HDFS的“全部配置”页面，在搜索框中输入参数名称。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS用户权限管理
配置HDFS用户访问HDFS文件权限 - MapReduce服务 MRS

/user/mapred:755 配置HDFS文件和目录的权限 HDFS支持用户进行文件和目录默认权限的修改。HDFS默认用户创建文件和目录的权限的掩码为“022”，如果默认权限满足不了用户的需求，可以通过配置项进行默认权限的修改。参数入口：请参考修改集群服务配置参数，进入HDFS的“全部配置”页面，在搜索框中输入参数名称。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS用户权限管理
Hive SQL运行变慢阶段如何排查 - MapReduce服务 MRS

以下为Hive SQL在哪个阶段执行变慢的排查方法： HiveServer编译变慢查看HiveServer审计日志“/var/log/Bigdata/audit/hive/hiveserver/hive-audit.log”，搜索运行的SQL，如图1的SQL为“show databas

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive故障排除
配置HDFS文件回收站机制 - MapReduce服务 MRS

配置场景在HDFS中，如果删除HDFS的文件，删除的文件将被移动到回收站（trash）中，不会被立即清除，以便在误操作的情况下恢复被删除的数据。被删除的文件在超过老化时间后将变为老化文件，会基于系统机制清除或用户手动清除。您可以设置文件保留在回收站中的时间阈值，一旦文件保存时间超过此

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
SQL防御概述 - MapReduce服务 MRS
SQL防御概述 - MapReduce服务 MRS

SQL防御概述当前大数据领域的SQL引擎层出不穷，在带给解决方案多样性的同时，也暴露出一定的问题，例如SQL输入语句质量良莠不齐、SQL问题难定位、大SQL语句消耗资源过多等。低质量的SQL会对数据分析平台系统带来不可预料的冲击，影响系统的性能或者平台稳定性。 SQL防御功能仅MRS

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群SQL防御规则
ALM-12180 磁盘卡IO（2.x及以前版本） - MapReduce服务 MRS

第一次采集的数据中，第4列的数字是“rd_ios_old”，第8列的数字是“wr_ios_old”，第13列的数字是“tot_ticks_old”。第二次采集的数据中，第4列的数字是“rd_ios_new”，第8列的数字是“wr_ios_new”，第13列的数字是“tot_ticks_new”。则上图中svctm值为：

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark INSERT SELECT语句调优 - MapReduce服务 MRS

SELECT操作可以进行一定的调优操作。查询的数据是大量的小文件。查询的数据是较多的大文件。在Beeline/JDBCServer模式下使用非Spark用户操作。操作步骤可对INSERT...SELECT操作做如下的调优操作。如果建的是Hive表，将存储类型设为Parquet，从而减少执行INSERT

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
使用OfflineMetaRepair工具重新构建元数据后HMaster启动失败 - MapReduce服务 MRS

动期间等待所有region server的WAL分割，以避免数据不一致问题。一旦WAL分割完成，HMaster将进行用户region的分配。所以当在集群异常的场景下，WAL分割可能需要很长时间，这取决于多个因素，例如太多的WALs，较慢的I/O，region servers不稳定等。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase故障排除
Kakfa消费者读取单条记录过长问题 - MapReduce服务 MRS

Kakfa消费者读取单条记录过长问题问题背景与现象和“Kafka生产者写入单条记录过长问题”相对应的，在写入数据后，用户开发一个应用，以消费者调用新接口（org.apache.kafka.clients.consumer.*）到Kafka上读取数据，但读取失败，报异常大致如下：

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
准备Spark应用Scala开发环境 - MapReduce服务 MRS

图3 Project Defaults 在打开的“Project Structure”页面中，选择“SDKs”，单击绿色加号添加JDK。图4 添加JDK 在弹出的“Select Home Directory for JDK”窗口，选择对应的JDK目录，然后单击“OK”。图5 选择JDK目录

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 准备Spark应用开发环境
Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

数据。原理：每次poll的数据处理完后才提交offset，如果poll数据后的处理时长超出了session.timeout.ms的设置时长，此时发生rebalance导致本次消费失败，已经消费数据的offset无法正常提交，所以下次重新消费时还是在旧的offset消费数据，从而导致消费数据重复。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka

总条数： 3959

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Linux环境中编包并运行Spark程序 - MapReduce服务 MRS

作业管理类 - MapReduce服务 MRS

在Linux环境中编包并运行Spark程序 - MapReduce服务 MRS

Hive常见日志说明 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

Storm业务拓扑配置GC参数不生效 - MapReduce服务 MRS

准备Impala开发和运行环境 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

ClickHouse数据查询 - MapReduce服务 MRS

配置HDFS用户访问HDFS文件权限 - MapReduce服务 MRS

配置HDFS用户访问HDFS文件权限 - MapReduce服务 MRS

Hive SQL运行变慢阶段如何排查 - MapReduce服务 MRS

配置HDFS文件回收站机制 - MapReduce服务 MRS

SQL防御概述 - MapReduce服务 MRS

ALM-12180 磁盘卡IO（2.x及以前版本） - MapReduce服务 MRS

Spark INSERT SELECT语句调优 - MapReduce服务 MRS

使用OfflineMetaRepair工具重新构建元数据后HMaster启动失败 - MapReduce服务 MRS

Kakfa消费者读取单条记录过长问题 - MapReduce服务 MRS

准备Spark应用Scala开发环境 - MapReduce服务 MRS

Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线