搜索_华为云

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的API。 Spark Core常用接口 Spark主要使用到如下这几个类： pyspark.SparkContext：是Spark的对外接口。负责向调用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的API。 Spark Core常用接口 Spark主要使用到如下这几个类： pyspark.SparkContext：是Spark的对外接口。负责向调用

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
配置YARN-Client和YARN-Cluster不同模式下的环境变量 - MapReduce服务 MRS

配置YARN-Client和YARN-Cluster不同模式下的环境变量配置场景当前，在YARN-Client和YARN-Cluster模式下，两种模式的客户端存在冲突的配置，即当客户端为一种模式的配置时，会导致在另一种模式下提交任务失败。为避免出现如上情况，添加表1中的配

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
创建Kafka Topic - MapReduce服务 MRS
创建Kafka Topic - MapReduce服务 MRS

创建Kafka Topic 操作场景用户可以根据业务需要，使用集群客户端或KafkaUI创建Kafka的主题。启用Kerberos认证的集群，需要拥有管理Kafka主题的权限。前提条件已安装客户端。使用Kafka客户端创建Kafka Topic 进入ZooKeeper实例页面：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka
配置NameNode黑名单功能 - MapReduce服务 MRS

配置NameNode黑名单功能配置场景本章节适用于MRS 3.x及后续版本。在现有的缺省DFSclient failover proxy provider中，一旦某进程中的一个NameNode发生故障，在同一进程中的所有HDFS client实例都会尝试再次连接NameNode，导致应用长时间等待超时。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
添加Oracle数据源 - MapReduce服务 MRS

添加Oracle数据源本章节适用于MRS 3.5.0及之后的版本。 HetuEngine支持配置Oracle数据源实现对Oracle数据源的接入与查询功能。本章节指导用户在集群的HSConsole界面添加Oracle类型的JDBC数据源。前提条件数据源与HetuEngine集群节点网络互通。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的API。 Spark Core常用接口 Spark主要使用到如下这几个类： pyspark.SparkContext：是Spark的对外接口。负责向调用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的开源API。 Spark Core常用接口 Spark主要使用到如下这几个类： SparkContext：是Spark的对外接口，负责向调用该类的scal

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark Python接口介绍 - MapReduce服务 MRS

Spark Python接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的开源API。 Spark Core常用接口 Spark主要使用到如下这几个类： pyspark.SparkContext：是Spark的对外接口。负责向调用该类

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
安装Flume客户端 - MapReduce服务 MRS

安装Flume客户端使用Flume搜集日志时，需要在日志主机上安装Flume客户端。用户可以创建一个新的ECS并安装Flume客户端。前提条件已创建包含Flume组件的集群。日志主机需要与MRS集群在相同的VPC和子网。已获取日志主机的登录方式。安装目录可以不存在，会

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
管理Loader连接（MRS 3.x及之后版本） - MapReduce服务 MRS

管理Loader连接（MRS 3.x及之后版本）操作场景 Loader页面支持创建、查看、编辑和删除连接。本章节适用于MRS 3.x及之后版本。创建连接登录服务页面： MRS 3.x及后续版本，登录FusionInsight Manager，具体请参见访问FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
配置通过ELB访问ClickHouse - MapReduce服务 MRS

配置通过ELB访问ClickHouse 当前ClickHouse不管是多分片还是多副本都是以集群方式部署，如果对外直接提供服务，将暴露多个节点服务，没有统一的访问入口。ClickHouse官方虽然提供了BalancedClickhouseDataSource的驱动方案，可以支持多

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
HBase开源增强特性 - MapReduce服务 MRS

HBase开源增强特性 HBase开源增强特性：HIndex HBase是一个Key-Value类型的分布式存储数据库。每张表的数据按照RowKey的字典顺序排序，因此，如果按照某个指定的RowKey去查询数据，或者指定某一个RowKey范围去扫描数据时，HBase可以快速定位到

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
使用Oozie客户端提交Spark2x任务 - MapReduce服务 MRS

使用Oozie客户端提交Spark2x任务操作场景该任务指导用户在使用Oozie客户端提交Spark2x任务。请下载使用最新版本的客户端。前提条件 Spark2x和Oozie组件安装完成且运行正常，客户端安装成功。如果当前客户端为旧版本，需要重新下载和安装客户端。已创

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Oozie客户端提交作业
配置NodeManager角色实例使用的资源 - MapReduce服务 MRS

配置NodeManager角色实例使用的资源操作场景如果部署NodeManager的各个节点硬件资源（如CPU核数、内存总量）不一样，而NodeManager可用硬件资源设置为相同的值，可能造成性能浪费或状态异常，需要修改各个NodeManager角色实例的配置，使硬件资源得到充分利用。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn企业级能力增强
使用Oozie客户端提交Spark2x任务 - MapReduce服务 MRS

使用Oozie客户端提交Spark2x任务操作场景该任务指导用户在使用Oozie客户端提交Spark2x任务。请下载使用最新版本的客户端。前提条件 Spark2x和Oozie组件安装完成且运行正常，客户端安装成功。如果当前客户端为旧版本，需要重新下载和安装客户端。已创

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Oozie客户端提交作业
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡配置场景 DiskBalancer是一个在线磁盘均衡器，旨在根据各种指标重新平衡正在运行的DataNode上的磁盘数据。工作方式与HDFS的Balancer工具类似。不同的是，HDFS Balancer工具用于DataNode节点间的数据均衡，而HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
创建FlinkServer作业写入数据至Hudi表 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Hudi表本章节适用于MRS 3.1.2及之后的版本。操作场景本指南通过使用FlinkServer写FlinkSQL对接Hudi。FlinkSQL读写Hudi时，不支持定义TINYINT、SMALLINT和TIME类型。 Flink对

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
迁移Kafka节点内数据 - MapReduce服务 MRS

迁移Kafka节点内数据操作场景用户可以根据业务需求，通过Kafka客户端命令，在不停止服务的情况下，进行节点内磁盘间的分区数据迁移。也可以通过KafkaUI进行分区迁移。前提条件 MRS集群管理员已明确业务需求，并准备一个Kafka用户（属于kafkaadmin组，普通模式不需要）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka运维管理
Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路场景说明假设需要跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp；同时输出本批次被更新状态的session。数据规划在kafka中生成模拟数据（需要有Kafka权限用户）。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序

总条数： 2280

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

配置YARN-Client和YARN-Cluster不同模式下的环境变量 - MapReduce服务 MRS

创建Kafka Topic - MapReduce服务 MRS

配置NameNode黑名单功能 - MapReduce服务 MRS

添加Oracle数据源 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

安装Flume客户端 - MapReduce服务 MRS

管理Loader连接（MRS 3.x及之后版本） - MapReduce服务 MRS

配置通过ELB访问ClickHouse - MapReduce服务 MRS

HBase开源增强特性 - MapReduce服务 MRS

使用Oozie客户端提交Spark2x任务 - MapReduce服务 MRS

配置NodeManager角色实例使用的资源 - MapReduce服务 MRS

使用Oozie客户端提交Spark2x任务 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Hudi表 - MapReduce服务 MRS

迁移Kafka节点内数据 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线