搜索_华为云

从零开始使用Spark - MapReduce服务 MRS

从零开始使用Spark 本章节提供从零开始使用Spark提交sparkPi作业的操作指导，sparkPi是最经典的Spark作业，它用来计算Pi（π）值。操作步骤准备sparkPi程序。开源的Spark的样例程序包含多个例子，其中包含sparkPi。可以从https://archive

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark（MRS 3.x之前版本）
使用Hudi - MapReduce服务 MRS
使用Hudi - MapReduce服务 MRS

使用Hudi Hudi表概述使用Spark Shell创建Hudi表使用spark-sql操作Hudi表 Hudi写操作 Hudi读操作 Hudi数据管理维护 Hudi SQL语法参考 Hudi Schema演进配置Hudi数据列默认值 Hudi支持Partial Update

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版）
使用Sqoop - MapReduce服务 MRS
使用Sqoop - MapReduce服务 MRS

使用Sqoop Sqoop如何连接MySQL Sqoop读取MySQL数据到HBase时报HBaseAdmin.<init>方法找不到异常通过Hue创建Sqoop任务将数据从HBase导入HDFS时报错通过Sqoop从Hive导出数据到MySQL 8.0时报数据格式错误通过sqoop

帮助中心 > MapReduce服务 MRS > 故障排除
MRS集群如何使用公网访问Presto - MapReduce服务 MRS

MRS集群如何使用公网访问Presto 用户问题用户调测Presto JDBC样例代码，需要使用公网访问Presto。问题分析登录MRS Manager上查看Presto全部配置，Coordinator角色配置： PRESTO_COORDINATOR_FLOAT_IP = 内网IP地址

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Presto
使用Kafka - MapReduce服务 MRS
使用Kafka - MapReduce服务 MRS

Kafka安全使用说明如何获取Kafka Consumer Offset信息如何针对Topic进行配置增加和删除如何读取“__consumer_offsets”内部topic的内容如何配置Kafka客户端shell命令日志如何获取Topic的分布信息 Kafka高可靠使用说明使用Kafka

帮助中心 > MapReduce服务 MRS > 故障排除
使用Hive - MapReduce服务 MRS
使用Hive - MapReduce服务 MRS

使用Hive Hive常见日志说明 Hive服务启动失败安全集群执行set命令的时候报错“Cannot modify xxx at runtime” 提交Hive任务时如何指定队列？怎么通过客户端设置Map/Reduce内存？如何在导入Hive表时指定输出的文件压缩格式？

帮助中心 > MapReduce服务 MRS > 故障排除
使用Storm - MapReduce服务 MRS
使用Storm - MapReduce服务 MRS

使用Storm 从零开始使用Storm 使用Storm客户端使用客户端提交Storm拓扑访问Storm的WebUI 管理Storm拓扑查看Storm拓扑日志 Storm常用参数配置Storm业务用户密码策略迁移Storm业务至Flink Storm日志介绍性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用HDFS - MapReduce服务 MRS
使用HDFS - MapReduce服务 MRS

使用HDFS 修改RPC端口后HDFS NameNode实例都变为备状态通过公网IP连接使用HDFS客户端报错使用Python远程连接HDFS的端口失败 HDFS容量达到100%导致上层服务HBase、Spark等不可用启动HDFS和Yarn服务报错“Permission denied”

帮助中心 > MapReduce服务 MRS > 故障排除
使用Loader导入数据 - MapReduce服务 MRS

过滤器类型选择文件过滤的条件。“WILCARD”表示使用通配符过滤，“REGEX”表示使用正则表达式匹配。与“路径过滤器”和“文件过滤器”配合使用。不选择值时默认为通配符过滤。路径过滤器与“过滤器类型”配合使用，配置通配符或正则表达式对源文件的输入路径包含的目录进行过滤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
如何使用IDEA远程调试 - MapReduce服务 MRS

如何使用IDEA远程调试问题在Spark二次开发中如何使用IDEA远程调试？回答以调试SparkPi程序为例，演示如何进行IDEA的远程调试：打开工程，在菜单栏中选择“Run > Edit Configurations”。在弹出的配置窗口中用鼠标左键单击左上角的号，在

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
如何使用IDEA远程调试 - MapReduce服务 MRS

如何使用IDEA远程调试问题在Spark二次开发中如何使用IDEA远程调试？回答以调试SparkPi程序为例，演示如何进行IDEA的远程调试：打开工程，在菜单栏中选择“Run > Edit Configurations”。在弹出的配置窗口中用鼠标左键单击左上角的号，在

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
如何使用IDEA远程调试 - MapReduce服务 MRS

如何使用IDEA远程调试问题在Spark二次开发中如何使用IDEA远程调试？回答以调试SparkPi程序为例，演示如何进行IDEA的远程调试。打开工程，在菜单栏中选择“Run > Edit Configurations”。在弹出的配置窗口中用鼠标左键单击左上角的“+”

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题
如何使用IDEA远程调试 - MapReduce服务 MRS

如何使用IDEA远程调试问题在Spark二次开发中如何使用IDEA远程调试？回答以调试SparkPi程序为例，演示如何进行IDEA的远程调试：打开工程，在菜单栏中选择“Run > Edit Configurations”。在弹出的配置窗口中用鼠标左键单击左上角的号，在

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
如何使用IDEA远程调试 - MapReduce服务 MRS

如何使用IDEA远程调试问题在Spark二次开发中如何使用IDEA远程调试？回答以调试SparkPi程序为例，演示如何进行IDEA的远程调试：打开工程，在菜单栏中选择“Run > Edit Configurations”。在弹出的配置窗口中用鼠标左键单击左上角的号，在

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
如何使用PySpark连接MRS Spark？ - MapReduce服务 MRS

如何使用PySpark连接MRS Spark？问：如何在ECS服务器上用PySpark连接内网开启Kerberos认证的MRS Spark集群？答：将Spark的“spark-defaults.conf”文件中“spark.yarn.security.credentials

帮助中心 > MapReduce服务 MRS > 常见问题 > 周边生态对接类
如何使用IDEA远程调试业务 - MapReduce服务 MRS

如何使用IDEA远程调试业务问题使用Storm客户端提交了业务之后，如何使用IDEA远程调试业务？回答以调试WordCount程序为例，演示如何进行IDEA的远程调试：登录FusionInsight Manager系统，选择“集群 > 待操作集群的名称 > 服务 > S

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
如何使用IDEA远程调试业务 - MapReduce服务 MRS

如何使用IDEA远程调试业务问题使用Storm客户端提交了业务之后，如何使用IDEA远程调试业务？回答以调试WordCount程序为例，演示如何进行IDEA的远程调试：登录FusionInsight Manager系统，选择“集群 > 待操作集群的名称 > 服务 > S

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
单NameNode长期故障时如何使用客户端手动checkpoint - MapReduce服务 MRS

单NameNode长期故障时如何使用客户端手动checkpoint 问题背景与现象在备NameNode长期异常的情况下，会积攒大量的editlog，此时如果重启HDFS或者主NameNode，主NameNode会读取大量的未合并的editlog，导致耗时启动较长，甚至启动失败。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志操作场景 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端（MRS 3.x之前版本）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume

总条数： 5780

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消