搜索_华为云

Loader常用参数 - MapReduce服务 MRS

范围 mapreduce.client.submit.file.replication MapReduce任务在运行时依赖的相关job文件在HDFS上的副本数。当集群中DataNode个数小于该参数值时，副本数等于DataNode的个数。当DataNode个数大于或等于该参数值，副本数为该参数值。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader运维管理
BulkPut接口使用 - MapReduce服务 MRS

BulkPut接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将构建的RDD写入HBase中。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表： create

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
导入并配置ClickHouse样例工程 - MapReduce服务 MRS

例介绍请参见ClickHouse样例工程介绍。在应用开发环境中，导入样例工程到IntelliJ IDEA开发环境。在IDEA界面选择“File > New > Project from Existing Sources”。在显示的“Select File or Directory

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（普通模式） > 准备ClickHouse应用开发环境
Spark Python API接口介绍 - MapReduce服务 MRS

Distributed Dataset）：用于在Spark应用程序中定义RDD的类，该类提供数据集的操作方法，如map，filter。 pyspark.Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

Distributed Dataset）：用于在Spark应用程序中定义RDD的类，该类提供数据集的操作方法，如map，filter。 pyspark.Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
配置Spark表、列和数据库的用户权限 - MapReduce服务 MRS

控制。如果要访问别人创建的表上某些列，需要授予列权限。以下介绍使用Manager角色管理功能在表授权、列授权和数据库授权三个场景下的操作。操作步骤 SparkSQL表授权、列授权、数据库授权与Hive的操作相同，详情请参见Hive用户权限管理。在权限管理中，为了方便用户使用，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
MRS集群Task节点弹性伸缩概述 - MapReduce服务 MRS

执行时机为扩容前的脚本不会在将要扩容出的Task节点上执行。执行时机为扩容后的脚本会在扩容出的Task节点上执行。执行时机为缩容前的脚本会在即将被删除的Task节点上执行。执行时机为缩容后的脚本不会在已经被删除的Task节点上执行。失败操作继续该脚本执行失败后，是否继续执行后续脚本和扩缩容操作。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整 > MRS集群Task节点弹性伸缩
Hive表支持级联授权功能 - MapReduce服务 MRS

开启级联授权功能的集群极大地提升了鉴权易用性，用户只需在Ranger页面上对业务表进行一次授权，系统就会自动细粒度关联数据存储源的权限，不需要感知表的存储路径，无需进行二次授权。同时也补齐了基于存算分离授权功能缺陷，可以在Ranger上实现对存算分离表的授权鉴权。Hive表的级联授权功能主要体现为：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Ranger > Ranger权限策略配置示例
快速开发Flink应用 - MapReduce服务 MRS

} } } 编译并运行程序在IntelliJ IDEA中，配置工程的Artifacts信息。在IDEA主页面，选择“File > Project Structures...”进入“Project Structure”页面。在“Project Structure”页

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划在客户端执行：hbase shell命令进入HBase命令行。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

在Linux环境中调测MapReduce应用操作场景在程序代码完成开发后，可以在Linux环境中运行应用。 MapReduce应用程序运行完成后，可通过如下方式查看应用程序的运行情况。通过运行结果查看程序运行情况。登录MapReduce WebUI查看应用程序运行情况。登录Yarn

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式） > 调测MapReduce应用
Hive WebHCat接口介绍 - MapReduce服务 MRS

Job创建后的Jobid 返回结果参数描述 status 包含job状态信息的json对象。 profile 包含job状态的json对象。WebHCat解析JobProfile对象中的信息，该对象因Hadoop版本不同而不同。 id Job的id。 percentComplete

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > Hive应用开发常见问题 > Hive对外接口介绍
Hive WebHCat接口介绍 - MapReduce服务 MRS

Job创建后的Jobid 返回结果参数描述 status 包含job状态信息的json对象。 profile 包含job状态的json对象。WebHCat解析JobProfile对象中的信息，该对象因Hadoop版本不同而不同。 id Job的id。 percentComplete

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > Hive应用开发常见问题 > Hive对外接口介绍
Spark Python API接口介绍 - MapReduce服务 MRS

Distributed Dataset）：用于在Spark应用程序中定义RDD的类，该类提供数据集的操作方法，如map，filter。 pyspark.Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python接口介绍 - MapReduce服务 MRS

Distributed Dataset）：用于在Spark应用程序中定义RDD的类，该类提供数据集的操作方法，如map，filter。 pyspark.Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份拷贝。 pyspark.StorageLevel：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
导入并配置Flink样例工程 - MapReduce服务 MRS

-normal”。在安全模式下，获取“src\flink-examples”下的样例工程flink-examples-security。在普通模式下，获取“src\flink-examples”下的样例工程flink-examples-normal。在导入样例工程之前，IntelliJ

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 准备Flink应用开发环境
管理Loader作业 - MapReduce服务 MRS

访问Loader页面，单击“新建作业”。在“基本信息”填写参数。在“名称”填写一个作业的名称。在“源连接”和“目的连接”选择对应的连接。选择某个类型的连接，表示从指定的源获取数据，并保存到目的位置。如果没有需要的连接，可单击“添加新连接”。在“自”填写源连接的作业配置。具体请参见Loader作业源连接配置说明。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
ClickHouse数据库应用开发 - MapReduce服务 MRS

备商用能力。如果在生产环境上使用实验特性，会给生产环境带来数据准确性、集群稳定性等多个方面的系统风险。建议查询增加重试机制 clickhouse-example.properties的配置文件的loadBalancerIPList可以配置多个ip，在二次样例代码中已经实现从第

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库开发
Spark Python API接口介绍 - MapReduce服务 MRS

Distributed Dataset）：用于在Spark应用程序中定义RDD的类，该类提供数据集的操作方法，如map，filter。 pyspark.Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍

总条数： 2482

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Loader常用参数 - MapReduce服务 MRS

BulkPut接口使用 - MapReduce服务 MRS

导入并配置ClickHouse样例工程 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

配置Spark表、列和数据库的用户权限 - MapReduce服务 MRS

MRS集群Task节点弹性伸缩概述 - MapReduce服务 MRS

Hive表支持级联授权功能 - MapReduce服务 MRS

快速开发Flink应用 - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

Hive WebHCat接口介绍 - MapReduce服务 MRS

Hive WebHCat接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

导入并配置Flink样例工程 - MapReduce服务 MRS

管理Loader作业 - MapReduce服务 MRS

ClickHouse数据库应用开发 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线