搜索_华为云

Spark Scala API接口介绍 - MapReduce服务 MRS

只能用在key-value对上，然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey(): Map[K, Long] 对每个key出现的次数做统计。 foreach(func: (T) => Unit): Unit 在数据集的每一个元素上，运行函数func。 countByValue()(implicit

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark Python接口介绍 - MapReduce服务 MRS

只能用在key-value对上，然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey() 对每个key出现的次数做统计。 foreach(func) 在数据集的每一个元素上，运行函数。 countByValue() 对RDD中每个不同value出现的次数进行统计。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark Python API接口介绍 - MapReduce服务 MRS

只能用在key-value对上，然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey() 对每个key出现的次数做统计。 foreach(func) 在数据集的每一个元素上，运行函数。 countByValue() 对RDD中每个不同value出现的次数进行统计。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

只能用在key-value对上，然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey() 对每个key出现的次数做统计。 foreach(func) 在数据集的每一个元素上，运行函数。 countByValue() 对RDD中每个不同value出现的次数进行统计。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
配置Kafka数据均衡工具 - MapReduce服务 MRS

overy-point-offset-checkpoint”和“replication-offset-checkpoint”文件（两个文件做同样的修改）。减少文件中第二行的数字（如果移出多个目录，则减少的数字为移出的目录个数）。删除待移出的Partition所在的行（行结构为“Topic名称

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka企业级能力增强
调整Spark Core进程参数 - MapReduce服务 MRS

NUM”参数设置核数。配置Executor内存。 Executor的内存主要用于任务执行、通信等。当一个任务很大的时候，可能需要较多资源，因而内存也可以做相应的增加；当一个任务较小运行较快时，就可以增大并发度减少内存。将“spark-defaults.conf”中的“spark.executor

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
配置Spark多租户模式 - MapReduce服务 MRS

proxy.idle.session.timeout 多租户模式下，JDBCServer代理session的空闲超时时间。如果在这段时间内没有做任何操作，session会被关闭。 7d spark.thriftserver.proxy.idle.session.check.operation

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强 > 配置Spark HA增强高可用
调整Spark Core进程参数 - MapReduce服务 MRS

NUM”参数设置核数。配置Executor内存。 Executor的内存主要用于任务执行、通信等。当一个任务很大的时候，可能需要较多资源，因而内存也可以做相应的增加；当一个任务较小运行较快时，就可以增大并发度减少内存。将“spark-defaults.conf”中的“spark.executor

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
流式写入Hudi表 - MapReduce服务 MRS

bigdata.hudi.examples.TransformerExample // 指定如何处理数据源拉取来的数据，可根据自身业务需求做定制 --enable-hive-sync // 开启hive同步，同步hudi表到hive --continuous // 指定流处理模式为连续模式

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
ClickHouse表字段设计 - MapReduce服务 MRS

例如“国家”是一个维度，如果有200个不同的值，那么此维度的基数就是200。根据官方建议和实践经验，在维度基数小于1万的时候，对维度字段做LowCardinality编码，导入性能会有略微下降，查询性能提升明显，数据存储空间下降明显。在默认的情况下，声明了LowCardina

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
增强有限内存下的稳定性 - MapReduce服务 MRS

不出现OutOfMemoryError。有限内存并不意味着内存无限小，它只是在内存不足于放下大于内存可用总量几倍的数据时，通过利用磁盘来做辅助从而确保查询依然稳定执行，但依然有一些数据是必须留在内存的，如在做涉及到Join的查询时，对于当前用于Join的相同key的数据还是需要

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
增强有限内存下的稳定性 - MapReduce服务 MRS

不出现OutOfMemoryError。有限内存并不意味着内存无限小，它只是在内存不足于放下大于内存可用总量几倍的数据时，通过利用磁盘来做辅助从而确保查询依然稳定执行，但依然有一些数据是必须留在内存的，如在做涉及到Join的查询时，对于当前用于Join的相同key的数据还是需要

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Spark Scala API接口介绍 - MapReduce服务 MRS

只能用在key-value对上，然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey(): Map[K, Long] 对每个key出现的次数做统计。 foreach(func: (T) => Unit): Unit 在数据集的每一个元素上，运行函数func。 countByValue()(implicit

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark scala API接口介绍 - MapReduce服务 MRS

只能用在key-value对上，然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey(): Map[K, Long] 对每个key出现的次数做统计。 foreach(func: (T) => Unit): Unit 在数据集的每一个元素上，运行函数func。 countByValue()(implicit

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
购买专属云MRS集群 - MapReduce服务 MRS

流式集群：用于流式数据处理任务，对实时数据源进行快速分析，主要包含Kafka、Flume等流式数据处理组件。混合集群：既可以用来做离线数据分析，也可以用来做流处理任务的集群。自定义：提供丰富的组件搭配，可自行选择对应版本MRS集群所支持的所有组件。自定义版本类型 MRS提供了

 帮助中心 > MapReduce服务 MRS > 用户指南 > 购买MRS集群
配置Kafka数据均衡工具 - MapReduce服务 MRS

overy-point-offset-checkpoint”和“replication-offset-checkpoint”文件（两个文件做同样的修改）。减少文件中第二行的数字（若移出多个目录，则减少的数字为移出的目录个数）。删除待移出的Partition所在的行（行结构为“Topic名称

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka企业级能力增强
Spark Scala API接口介绍 - MapReduce服务 MRS

只能用在key-value对上，然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey(): Map[K, Long] 对每个key出现的次数做统计。 foreach(func: (T) => Unit): Unit 在数据集的每一个元素上，运行函数func。 countByValue()(implicit

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Scala API接口介绍 - MapReduce服务 MRS

只能用在key-value对上，然后生成SequenceFile写到本地或者hadoop文件系统。 countByKey(): Map[K, Long] 对每个key出现的次数做统计。 foreach(func: (T) => Unit): Unit 在数据集的每一个元素上，运行函数func。 countByValue()(implicit

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
计费说明 - MapReduce服务 MRS
计费说明 - MapReduce服务 MRS

配置弹性伸缩：根据业务数据量的变化动态调整集群Task节点数量以增减资源，请参见配置弹性伸缩规则。若MRS提供的变更配置方式不满足您的要求，您也可以通过重建集群，然后做数据迁移的方式实现集群配置的变更。续费如需续费，请进入“续费管理”页面进行续费操作。欠费包年/包月集群，没有欠费的概念。按需购买的

 帮助中心 > MapReduce服务 MRS > 产品介绍
Spark应用开发规则 - MapReduce服务 MRS

出的就是初始化这个变量时的值null，这就是空指针异常的原因。应用程序结束之前必须调用SparkContext.stop 利用spark做二次开发时，当应用程序结束之前必须调用SparkContext.stop()。利用Java语言开发时，应用程序结束之前必须调用JavaSparkContext

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范

总条数： 374

上一页
1
...
13
14
15
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

配置Kafka数据均衡工具 - MapReduce服务 MRS

调整Spark Core进程参数 - MapReduce服务 MRS

配置Spark多租户模式 - MapReduce服务 MRS

调整Spark Core进程参数 - MapReduce服务 MRS

流式写入Hudi表 - MapReduce服务 MRS

ClickHouse表字段设计 - MapReduce服务 MRS

增强有限内存下的稳定性 - MapReduce服务 MRS

增强有限内存下的稳定性 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark scala API接口介绍 - MapReduce服务 MRS

购买专属云MRS集群 - MapReduce服务 MRS

配置Kafka数据均衡工具 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

计费说明 - MapReduce服务 MRS

Spark应用开发规则 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线