搜索_华为云

Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

store以及数据库，支持对于可变状态的细粒度更新，这一点要求集群需要对数据或者日志的更新进行备份来保障容错性。这样就会给数据密集型的工作流带来大量的IO开销。而对于RDD来说，它只有一套受限制的接口，仅支持粗粒度的更新，例如map，join等等。通过这种方式，Spark只需要简单的记录建立数据的转换操作的

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
MapReduce Shuffle调优 - MapReduce服务 MRS

Shuffle阶段是MapReduce性能的关键部分，包括了从Map task将中间数据写到磁盘一直到Reduce task拷贝数据并最终放到reduce函数的全部过程。这部分Hadoop提供了大量的调优参数。图1 Shuffle过程操作步骤 Map阶段的调优判断Map使用的内存大小判断Map分配的内存是否

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
mapPartition接口使用 - MapReduce服务 MRS

使用mapPartition接口遍历上述rowkey对应的数据信息，并进行简单的操作。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中调测Spark应用。将打包生成的jar包上传到Spark客户端所在服务器的任意目录（例如“$SPARK_HOME”

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
Loader常用参数 - MapReduce服务 MRS

议将作业的Map数设置为大于等于3，推荐在作业数据量大的场景下使用。 0 0～1.0 loader.input.field.separator 默认的输入字段分割符，需要配置输入与输出转换步骤才生效，转换步骤的内容可以为空；如果作业的转换步骤中没有配置分割符，则以此处的默认分割符为准。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
mapPartition接口使用 - MapReduce服务 MRS

使用mapPartition接口遍历上述rowkey对应的数据信息，并进行简单的操作。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中编包并运行Spark程序。将打包生成的jar包上传到Spark客户端所在服务器的任意目录（例如“$SPARK_HOME”

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
mapPartitions接口使用 - MapReduce服务 MRS

Manager中下载principal用户的认证凭证，样例代码中使用的用户为：super，需要修改为准备好的开发用户。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中调测Spark应用。将打包生成的jar包上传到Spark客户端所在服务器的任意目录（例如“$SPARK_HOME”

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
Mapreduce应用开发规则 - MapReduce服务 MRS

IOException, InterruptedException { //自定义的实现 } /** * setup()方法只在进入map任务的map()方法之前或者reduce任务的reduce()方法之前调用一次 */ public void setup(Context context)

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Mapreduce应用开发规范
mapPartitions接口使用 - MapReduce服务 MRS

Manager中下载principal用户的认证凭证，样例代码中使用的用户为：super，需要修改为准备好的开发用户。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中编包并运行Spark程序。将打包生成的jar包上传到Spark客户端所在服务器的任意目录（例如“$SPARK_HOME”

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
HDFS基本原理 - MapReduce服务 MRS
HDFS基本原理 - MapReduce服务 MRS

HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在现有文件之后的添加操作。HDFS

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
配置MapReduce应用安全认证 - MapReduce服务 MRS

配置MapReduce应用安全认证场景说明在安全集群环境下，各个组件之间的相互通信不能够简单地互通，而需要在通信之前进行相互认证，以确保通信的安全性。用户在提交MapReduce应用程序时，需要与Yarn、HDFS等之间进行通信。那么提交MapReduce的应用程序中需要写入安全认证代码，确保MapReduce程序能够正常运行。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（安全模式） > 准备MapReduce应用开发环境
Doris UDF开发规范 - MapReduce服务 MRS

Doris UDF开发规范本章节主要介绍开发Doris UDF程序时应遵循的规则和建议。 Doris UDF开发规则 UDF中方法调用必须是线程安全的。 UDF实现中禁止读取外部大文件到内存中，如果文件过大可能会导致内存耗尽。需避免大量递归调用，否则容易造成栈溢出或oom。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
Hive服务健康状态和Hive实例健康状态的区别 - MapReduce服务 MRS

四种状态除了取决于Hive本身服务的可用性（会用简单的SQL来检测Hive服务的可用性），还取决于Hive服务所依赖的其他组件的服务状态。 Hive实例分为Hiveserver和Metastore两种，健康状态有Good，Concerning ，Unknown三种状态，这三种状态是通

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
Geospatial函数 - MapReduce服务 MRS
Geospatial函数 - MapReduce服务 MRS

Consortium ）制定的一种文本标记语言，用于表示矢量几何对象、空间参照系统及空间参照系统之间的转换。 WKB(well-known binary) 是WKT的二进制表示形式，解决了WKT表达方式冗余的问题，便于传输和在数据库中存储相同的信息。 GeoJSON一种JSON格式的Featur

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
获取MRS应用开发样例工程 - MapReduce服务 MRS

d SDK”的版块，按照页面弹出的设置方法进行操作。如果不想覆盖Maven配置文件，也可以参考以下方法手动修改“settings.xml”配置文件或者组件样例工程中的“pom.xml”文件，配置镜像仓地址。配置方法一：手动在“settings.xml”配置文件的“mirrors”节点中添加以下开源镜像仓地址：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x）
Manager Java API接口介绍 - MapReduce服务 MRS

接口，用户只需提供每类操作对应的URL，以及操作对应的json文件或json的String格式，无需编写中间的执行代码，减少了代码编写量，简化了用户执行各类操作的步骤。以上接口会返回请求对应的命令编号，方便用户根据命令编号查询命令执行的进度。父主题： Manager应用开发常见问题

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Manager管理开发指南 > Manager应用开发常见问题
获取MRS应用开发样例工程 - MapReduce服务 MRS

d SDK”的版块，按照页面弹出的设置方法进行操作。如果不想覆盖Maven配置文件，也可以参考以下方法手动修改“settings.xml”配置文件或者组件样例工程中的“pom.xml”文件，配置镜像仓地址。配置方法一：手动在“settings.xml”配置文件的“mirrors”节点中添加以下开源镜像仓地址：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版）
条件表达式 - MapReduce服务 MRS
条件表达式 - MapReduce服务 MRS

条件表达式 CASE 标准的SQL CASE表达式有两种模式。 “简单模式”从左向右查找表达式的每个value，直到找出相等的expression： CASE expression WHEN value THEN result [ WHEN ... ] [ ELSE result

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
HoodieDeltaStreamer - MapReduce服务 MRS

HoodieDeltaStreamer 编写自定义的转化类实现Transformer。编写自定义的Schema实现SchemaProvider。在执行HoodieDeltaStreamer时加入参数： --schemaprovider-class 定义的schema类 --transformer-class

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Hudi的自定义配置项样例程序
HoodieDeltaStreamer - MapReduce服务 MRS

HoodieDeltaStreamer 编写自定义的转化类实现Transformer。编写自定义的Schema实现SchemaProvider。在执行HoodieDeltaStreamer时加入参数： --schemaprovider-class 定义的schema类 --transformer-class

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Hudi的自定义配置项样例程序
Spark SQL样例程序（Scala） - MapReduce服务 MRS

//筛选出时间大于两个小时的女性网民信息，并输出 val c = femaleTimeInfo.filter("stayTime >= 120").collect().foreach(println) spark.stop() } } 上面是简单示例，其它spark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序

总条数： 1783

上一页
1
...
6
7
8
...
90
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark基本原理 - MapReduce服务 MRS

MapReduce Shuffle调优 - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

Loader常用参数 - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

mapPartitions接口使用 - MapReduce服务 MRS

Mapreduce应用开发规则 - MapReduce服务 MRS

mapPartitions接口使用 - MapReduce服务 MRS

HDFS基本原理 - MapReduce服务 MRS

配置MapReduce应用安全认证 - MapReduce服务 MRS

Doris UDF开发规范 - MapReduce服务 MRS

Hive服务健康状态和Hive实例健康状态的区别 - MapReduce服务 MRS

Geospatial函数 - MapReduce服务 MRS

获取MRS应用开发样例工程 - MapReduce服务 MRS

Manager Java API接口介绍 - MapReduce服务 MRS

获取MRS应用开发样例工程 - MapReduce服务 MRS

条件表达式 - MapReduce服务 MRS

HoodieDeltaStreamer - MapReduce服务 MRS

HoodieDeltaStreamer - MapReduce服务 MRS

Spark SQL样例程序（Scala） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线