搜索_华为云

Spark Python API接口介绍 - MapReduce服务 MRS

Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：数据存储级别。有内存（MEMORY_ONLY），磁盘（DISK_ONLY），内存+磁盘（MEMORY_AND_DISK）等。 pyspark.sql

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark SQL join优化 - MapReduce服务 MRS

B表都有个名为name的列。对A、B表进行join操作。估计表的大小。根据每次加载数据的大小，来估计表大小。也可以在Hive的数据库存储路径下直接查看表的大小。首先在Spark的配置文件“hive-site.xml”中，查看Hive的数据库路径的配置，默认为“/user/hive/warehouse”。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > SQL和DataFrame调优
实时任务接入 - MapReduce服务 MRS

'obs://XXXXXXXXXXXXXXXXXX/', --指定Hudi表的存储路径。 'table.type' = 'MERGE_ON_READ',

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
MRS 3.0.5.1补丁说明 - MapReduce服务 MRS

MRS 3.0.5.1补丁说明补丁基本信息表1 补丁基本信息补丁号 MRS 3.0.5.1 发布时间 2021-08-14 解决的问题 MRS 3.0.5.1 修复问题列表： MRS Manager 解决SQL语句过长导致作业管理界面提交SparkSQL作业失败的问题解决带有注释的SQL语句作业执行失败问题

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
Spark Python API接口介绍 - MapReduce服务 MRS

Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：数据存储级别。有内存（MEMORY_ONLY），磁盘（DISK_ONLY），内存+磁盘（MEMORY_AND_DISK）等。 pyspark.sql

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Scala API接口介绍 - MapReduce服务 MRS

Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份拷贝。 StorageLevel：数据存储级别。有内存（MEMORY_ONLY），磁盘（DISK_ONLY），内存+磁盘（MEMORY_AND_DISK）等。 RDD上支持两种类型

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark Python接口介绍 - MapReduce服务 MRS

Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份拷贝。 pyspark.StorageLevel：数据存储级别。有内存（MEMORY_ONLY），磁盘（DISK_ONLY），内存+磁盘（MEMORY_AND_DISK）等。 pyspark.sql

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
添加Ranger权限策略 - MapReduce服务 MRS

添加Ranger权限策略新安装的MRS集群默认安装Ranger服务并启用了Ranger鉴权模型，Ranger管理员可以通过组件权限插件对组件资源的访问设置细粒度的安全访问策略。目前安全模式集群中支持Ranger的组件包括：HDFS、Yarn、HBase、Hive、Spark2x、Kafka、Storm。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x）
添加Storm的Ranger访问权限策略 - MapReduce服务 MRS

添加Storm的Ranger访问权限策略操作场景 Ranger管理员可通过Ranger为Storm用户进行相关的权限设置。前提条件已安装Ranger服务且服务运行正常。已创建用户需要配置权限的用户、用户组或Role。页面已启用Ranger鉴权开关，该按钮控制是否启用Ra

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x） > Ranger权限策略配置示例
Spark Python API接口介绍 - MapReduce服务 MRS

Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：数据存储级别。有内存（MEMORY_ONLY），磁盘（DISK_ONLY），内存+磁盘（MEMORY_AND_DISK）等。 pyspark.sql

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

Broadcast：广播变量类。广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份复制。 pyspark.StorageLevel：数据存储级别。有内存（MEMORY_ONLY），磁盘（DISK_ONLY），内存+磁盘（MEMORY_AND_DISK）等。 pyspark.sql

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
配置MRS集群弹性伸缩 - MapReduce服务 MRS

点”，进入“配置Task节点”页面。配置“节点类型”、“节点规格”、“节点数量”、“系统盘”，如开启“添加数据盘”后，还需要配置数据盘的存储类型、大小和数量。单击“确定”。弹性伸缩规则与资源计划叠加使用登录MRS管理控制台。选择“现有集群”，单击待操作的集群名称，进入集群详情页面。

帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
数据复制 - MapReduce服务 MRS
数据复制 - MapReduce服务 MRS

线下集群向云迁移线下集群可以通过如下两种方式将数据迁移至云：云专线（DC）为源集群与目标集群之间建立云专线，打通线下集群出口网关与线上VPC之间的网络，然后参考同Region执行Distcp进行复制。数据快递服务（DES）对于TB或PB级数据上云的场景，华为云提供数据快递服务

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移 > 数据迁移方案介绍
ALM-12033 慢盘故障（2.x及以前版本） - MapReduce服务 MRS

详情”区域，获取告警所在主机信息和故障磁盘信息。确认上报告警的节点是否为虚拟化环境。是，执行3。否，执行6。请检查虚拟化环境提供的存储性能是否满足硬件要求，检查完毕之后执行4。以root用户登录告警节点，执行df -h命令，查看输出内容是否包含“磁盘名”字段的值。是，执行6。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用Flume服务端从本地采集动态日志保存到HDFS - MapReduce服务 MRS

使用Flume服务端从本地采集动态日志保存到HDFS 该任务指导用户使用Flume服务端从本地采集动态日志保存到HDFS上“/flume/test”目录下。本配置默认集群网络环境是安全的，数据传输过程不需要启用SSL认证。如需使用加密方式，请参考配置Flume加密传输数据采集任

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > 配置Flume非加密传输数据采集任务
在Linux环境中调测HBase应用 - MapReduce服务 MRS

在Linux环境中调测HBase应用操作场景 HBase应用程序支持在已安装或未安装HBase客户端的Linux环境中运行。在程序代码完成开发后，您可以上传Jar包至Linux环境中运行应用。前提条件已安装客户端时：已安装HBase客户端。当客户端所在主机不是集群中的节

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > 调测HBase应用
HBase应用开发常用概念 - MapReduce服务 MRS

HBase应用开发常用概念过滤器过滤器提供了非常强大的特性来帮助用户提高HBase处理表中数据的效率。用户不仅可以使用HBase中预定义好的过滤器，而且可以实现自定义的过滤器。协处理器允许用户执行region级的操作，并且可以使用与RDBMS中触发器类似的功能。 Client

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发概述
Hive SQL扩展语法说明 - MapReduce服务 MRS

"locatorId"="locator1")] ...; 创建一个hive表，并指定表数据文件分布的locator信息。详细说明请参见使用HDFS Colocation存储Hive表。 CREATE TABLE tab1 (id INT, name STRING) row format delimited fields

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见SQL语法说明
在Linux环境中调测HBase应用 - MapReduce服务 MRS

在Linux环境中调测HBase应用操作场景 HBase应用程序支持在已安装或未安装HBase客户端的Linux环境中运行。在程序代码完成开发后，您可以上传Jar包至准备好的Linux运行环境中运行。前提条件已安装客户端时：已安装HBase客户端。当客户端所在主机不是集

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 调测HBase应用
ALM-12049 网络读吞吐率超过阈值 - MapReduce服务 MRS

以root用户登录告警所在主机，用户密码为安装前用户自定义，请咨询系统管理员。执行命令ethtool 网口名称，查看当前网口速率最大值Speed。对于虚拟机环境，通过命令可能无法查询到网口速率，建议直接联系系统管理确认网口速率是否满足需求。若网络读吞吐率超过阈值，直接联系网络管理员，提升网口速率。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 3080

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Python API接口介绍 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

实时任务接入 - MapReduce服务 MRS

MRS 3.0.5.1补丁说明 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

添加Ranger权限策略 - MapReduce服务 MRS

添加Storm的Ranger访问权限策略 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

配置MRS集群弹性伸缩 - MapReduce服务 MRS

数据复制 - MapReduce服务 MRS

ALM-12033 慢盘故障（2.x及以前版本） - MapReduce服务 MRS

使用Flume服务端从本地采集动态日志保存到HDFS - MapReduce服务 MRS

在Linux环境中调测HBase应用 - MapReduce服务 MRS

HBase应用开发常用概念 - MapReduce服务 MRS

Hive SQL扩展语法说明 - MapReduce服务 MRS

在Linux环境中调测HBase应用 - MapReduce服务 MRS

ALM-12049 网络读吞吐率超过阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线