搜索_华为云

Spark Python API接口介绍 - MapReduce服务 MRS

SQL功能和DataFrame的主入口。 pyspark.sql.DataFrame：是一个以命名列方式组织的分布式数据集。 pyspark.sql.HiveContext：获取存储在Hive中数据的主入口。 pyspark.sql.DataFrameStatFunctions：统计功能中一些函数。 pyspark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

SQL功能和DataFrame的主入口。 pyspark.sql.DataFrame：是一个以命名列方式组织的分布式数据集。 pyspark.sql.HiveContext：获取存储在Hive中数据的主入口。 pyspark.sql.DataFrameStatFunctions：统计功能中一些函数。 pyspark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
添加HetuEngine的Ranger访问权限策略 - MapReduce服务 MRS

All：全选/取消全选如需添加多条权限控制规则，可单击按钮添加。如需当前条件中的用户或用户组管理本条策略，可勾选“Delegate Admin”，这些用户将成为受委托的管理员。被委托的管理员可以更新、删除本策略，它还可以基于原始策略创建子策略。 Deny Conditions 策

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Ranger > Ranger权限策略配置示例
上传应用数据至MRS集群 - MapReduce服务 MRS

据导入操作生成一个Distcp作业处理，也可在“作业管理”中查看作业执行状态。导出HDFS数据至OBS 登录MRS管理控制台。选择“现有集群”，选中一集群并单击集群名进入集群基本信息页面。单击“文件管理”，进入“文件管理”页面。选择“HDFS文件列表”。进入数据存储目录。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业
MRS集群的节点如何安装主机安全服务？ - MapReduce服务 MRS

作系统列表范围内。登录MRS管理控制台。在左侧导航栏中选择“现有集群”，单击目标集群名称，进入集群信息页面。在集群信息页面中，选择“节点管理”页签，单击目标节点组，在展开的节点名称列中单击任一节点，跳转到云服务基本信息控制台。图1 节点管理在云服务器详情页面中，选择“基

 帮助中心 > MapReduce服务 MRS > 常见问题 > 周边生态对接类
Spark Python API接口介绍 - MapReduce服务 MRS

SQL功能和DataFrame的主入口。 pyspark.sql.DataFrame：是一个以命名列方式组织的分布式数据集。 pyspark.sql.HiveContext：获取存储在Hive中数据的主入口。 pyspark.sql.DataFrameStatFunctions：统计功能中一些函数。 pyspark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python接口介绍 - MapReduce服务 MRS

SQL功能和DataFrame的主入口。 pyspark.sql.DataFrame：是一个以命名列方式组织的分布式数据集。 pyspark.sql.HiveContext：获取存储在Hive中数据的主入口。 pyspark.sql.DataFrameStatFunctions：统计功能中一些函数。 pyspark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark应用开发简介 - MapReduce服务 MRS

DStream(又称Discretized Stream)是Spark Streaming提供的抽象概念。 DStream表示一个连续的数据流，是从数据源获取或者通过输入流转换生成的数据流。从本质上说，一个DStream表示一系列连续的RDD。RDD是一个只读的、可分区的分布式数据集。 DStr

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
在Hue WebUI使用文件浏览器 - MapReduce服务 MRS

Manager界面，选择“系统设置 > 权限配置 > 角色管理 > 添加角色”：设置“角色名称”。选择“权限 > Hue”，勾选"Storage Policy Admin"，单击“确定”，为该角色赋予存储策略管理员的权限。选择“系统设置 > 权限配置 > 用户组管理 > 添加用户组”，设置“组名”，

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x之前版本）
配置HetuEngine SQL诊断功能 - MapReduce服务 MRS

SQL诊断能力后，系统可实现如下能力：自动感知并向集群管理员展现不同时间周期范围内的租户级、用户级的SQL任务统计，帮助集群管理员快速预判业务运行状态和潜在风险。自动诊断出大SQL、慢SQL及相关提交信息，面向集群管理员多维度可视化呈现，同时提供大SQL、慢SQL的诊断与优化建议。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
恢复HDFS业务数据 - MapReduce服务 MRS

操作场景在用户意外修改、删除或需要找回数据时，系统管理员对HDFS进行重大操作（如升级、重大数据调整等）后，系统数据出现异常或未达到预期结果，模块全部故障无法使用，或者迁移数据到新集群的场景中，需要对HDFS进行恢复数据操作。系统管理员可以通过FusionInsight Manag

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 恢复MRS集群组件数据
备份HBase元数据 - MapReduce服务 MRS

者文件损坏导致HBase服务不可用，或者系统管理员需要对HBase系统表进行重大操作（如升级或迁移等）时，需要对HBase元数据进行备份，从而保证系统在出现异常或未达到预期结果时可以及时进行数据恢复，将对业务的影响降到最低。系统管理员可以通过FusionInsight Mana

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 备份MRS集群组件数据
Spark应用开发简介 - MapReduce服务 MRS

DStream(又称Discretized Stream)是Spark Streaming提供的抽象概念。 DStream表示一个连续的数据流，是从数据源获取或者通过输入流转换生成的数据流。从本质上说，一个DStream表示一系列连续的RDD。RDD是一个只读的、可分区的分布式数据集。 DStr

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Spark应用开发简介 - MapReduce服务 MRS

DStream(又称Discretized Stream)是Spark Streaming提供的抽象概念。 DStream表示一个连续的数据流，是从数据源获取或者通过输入流转换生成的数据流。从本质上说，一个DStream表示一系列连续的RDD。RDD是一个只读的、可分区的分布式数据集。 DStr

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
Spark Python API接口介绍 - MapReduce服务 MRS

SQL功能和DataFrame的主入口。 pyspark.sql.DataFrame：是一个以命名列方式组织的分布式数据集。 pyspark.sql.HiveContext：获取存储在Hive中数据的主入口。 pyspark.sql.DataFrameStatFunctions：统计功能中一些函数。 pyspark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
在集群外节点连接开启Kerberos认证的集群，HTTP在Kerberos数据库中无法找到相应的记录 - MapReduce服务 MRS

java:239) ... 3 more 回答客户端拼接出的HTTP的principal与Kerberos数据库中的不一致（报错1）或获取的token无法链接Presto。在集群上执行cat /etc/hosts，将Presto coordinator的IP和hostnam

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > Presto应用开发常见问题
设置HBase和HDFS的句柄数限制 - MapReduce服务 MRS

此时可以参考该章节设置HBase和HDFS的句柄数。设置HBase和HDFS的句柄数限制联系集群管理员增加各用户的句柄数。该配置为操作系统的配置，并非HBase或者HDFS的配置。建议集群管理员根据HBase和HDFS的业务量及各操作系统用户的权限进行句柄数设置。如果某一个用户需对业

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
ALM-12007 进程故障（2.x及以前版本） - MapReduce服务 MRS

实例进程异常。磁盘空间不足。处理步骤检查实例进程是否异常。打开MRS集群详情页面，在告警管理页签的告警列表中，单击此告警所在行，在告警详情中，查看该告警的主机名称与服务名称。在“告警管理”页面，查看是否有ALM-12006 节点故障（2.x及以前版本）产生。是，执行1.c。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
执行MRS集群健康检查 - MapReduce服务 MRS

在MRS管理控制台执行健康检查登录MRS管理控制台。选择“现有集群”，选中一个运行中的集群并单击集群名称，进入集群信息页面。启动健康检查。在MRS管理控制台执行健康检查管理操作仅适用于MRS 1.9.2集群。手动执行所有服务的健康检查：选择“管理操作 > 启动集群健康检查”。手动执行单个服务的健康检查：

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群健康检查
设置HBase和HDFS的句柄数限制 - MapReduce服务 MRS

此时可以参考该章节设置HBase和HDFS的句柄数。设置HBase和HDFS的句柄数限制联系集群管理员增加各用户的句柄数。该配置为操作系统的配置，并非HBase或者HDFS的配置。建议集群管理员根据HBase和HDFS的业务量及各操作系统用户的权限进行句柄数设置。如果某一个用户需对业

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS

总条数： 3212

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

添加HetuEngine的Ranger访问权限策略 - MapReduce服务 MRS

上传应用数据至MRS集群 - MapReduce服务 MRS

MRS集群的节点如何安装主机安全服务？ - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

在Hue WebUI使用文件浏览器 - MapReduce服务 MRS

配置HetuEngine SQL诊断功能 - MapReduce服务 MRS

恢复HDFS业务数据 - MapReduce服务 MRS

备份HBase元数据 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

在集群外节点连接开启Kerberos认证的集群，HTTP在Kerberos数据库中无法找到相应的记录 - MapReduce服务 MRS

设置HBase和HDFS的句柄数限制 - MapReduce服务 MRS

ALM-12007 进程故障（2.x及以前版本） - MapReduce服务 MRS

执行MRS集群健康检查 - MapReduce服务 MRS

设置HBase和HDFS的句柄数限制 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线