搜索_华为云

Spark Scala API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path: String): Unit 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path: String, codec:

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark Python接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
快速开发Hive JDBC应用 - MapReduce服务 MRS

Manager创建用于样例工程安全认证的集群用户。选择“系统 > 权限 > 用户 > 添加用户”，在新增用户界面创建一个机机用户，例如developuser。 “用户组”需加入“hive”、“supergroup”用户组。选择“系统 > 权限 > 用户”，在用户名为“developuser”的操作列选择“更多

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
退服和入服MRS角色实例 - MapReduce服务 MRS

DataNode入服退服：默认情况下，当DataNode数量少于或等于HDFS的副本数时，不能执行退服操作。若HDFS副本数为3时，则系统中少于4个DataNode，将无法执行退服，Manager在执行退服操作时会等待30分钟后报错并退出执行。针对MRS 3.3.0及之后版

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群组件
查看HDFS容量状态 - MapReduce服务 MRS

ameNode文件对象总量增加，需要消耗更多的内存，使集群现有硬件可能会难以满足业务需求，且导致集群难以扩展。规划存储大量文件的HDFS系统容量，就是规划NameNode的容量规格和DataNode的容量规格，并根据容量设置参数。容量规格以下相关参数可以参考修改集群服务配置

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
创建Hive用户自定义函数 - MapReduce服务 MRS

集群属性”，查看集群的“认证模式”并记录。选择“集群 > 服务 > Hive”，单击页面右上角的“更多”查看Hive是否启用Ranger鉴权。选择“系统 > 权限 > 用户”，单击“添加用户”，配置以下参数并单击“确定”，创建执行自定义函数的用户：用户名：填写用户名称，例如：test。用户类型：选择“人机”用户。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
Spark Python API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
配置ClickHouse通过Kerberos认证对接Kafka - MapReduce服务 MRS

登录Kafka服务所在集群的Manager页面，选择“系统 > 权限 > 用户 > 添加用户”，创建一个具有Kafka权限的用户，例如创建机机用户ck_user1。Kafka用户权限介绍请参考Kafka用户权限说明。选择“系统 > 权限 > 用户”，在用户名中选择ck_user1，单击操作列的“更多

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入 > 配置ClickHouse对接Kafka
离线数据加载：通过StreamLoad将本地CSV文件导入Doris - MapReduce服务 MRS

用户名为dorisuser），并修改初始密码。登录Doris集群Manager页面，详细操作请参考访问MRS集群Manager。选择“系统 > 权限 > 角色 > 添加角色”，填写角色名称，如“dorisrole”，在“配置资源权限”选择“待操作的集群 > Doris”，勾选

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

Receiver将数据流分成一系列小块，存储到Executor内存中。另外，在启用预写日志（Write-ahead Log，简称WAL）以后，数据同时还写入到容错文件系统的预写日志中。通知Driver（绿色箭头）接收块中的元数据（Metadata）被发送到Driver的StreamingContext。这个元数据包括：

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
开源sqoop-shell工具使用指导 - MapReduce服务 MRS

命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。通过Kerberos模式认证： ./sqoop2-shell -uk true -k user.keytab -s userPrincipal 系统显示如下信息： Welcome to sqoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
Spark常用配置参数 - MapReduce服务 MRS

（仅hash方式）如果要合并在shuffle过程中创建的中间文件，需要将该值设置为“true”。文件创建的少可以提高文件系统处理性能，降低风险。使用ext4或者xfs文件系统时，建议设置为“true”。由于文件系统限制，在ext3上该设置可能会降低8核以上机器的处理性能。 false spark.shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
常用参数 - MapReduce服务 MRS
常用参数 - MapReduce服务 MRS

（仅hash方式）若要合并在shuffle过程中创建的中间文件，需要将该值设置为“true”。文件创建的少可以提高文件系统处理性能，降低风险。使用ext4或者xfs文件系统时，建议设置为“true”。由于文件系统限制，在ext3上该设置可能会降低8核以上机器的处理性能。 false spark.shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

通过如下配置项可开启自动进行数据倾斜处理功能，通过将Hash分桶后数据量很大的、且超过数据倾斜阈值的分桶拆散，变成多个task处理一个桶的数据机制，提高CPU资源利用率，提高系统性能。未产生倾斜的数据，将采用原有方式进行分桶并运行。使用约束：只支持两表Join的场景。不支持FULL OUTER JOIN的数据倾斜处理。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
修改集群服务配置参数 - MapReduce服务 MRS

示参数分类。（下图以HDFS组件为例）在导航树选择指定的参数分类，并在右侧修改参数值。不确定参数的具体位置时，支持在右上角输入参数名，系统将实时进行搜索并显示结果。（下图以HDFS组件为例）单击“保存配置”，并在确认对话框中单击“是”。等待界面提示“操作成功”，单击“完成”，配置已修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作
MapReduce REST API接口介绍 - MapReduce服务 MRS

85.2为MapReduce的“JHS_FLOAT_IP”参数的参数值，26014为JobHistoryServer的端口号。在部分低版本操作系统中使用curl命令访问JobHistoryServer会有兼容性问题，导致无法返回正确结果。用户能看到历史任务的状态信息（任务ID，开始时间，结束时间，是否执行成功等信息）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（安全模式） > MapReduce应用开发常见问题 > MapReduce接口介绍
配置Spark表、列和数据库的用户权限 - MapReduce服务 MRS

在权限管理中，为了方便用户使用，授予数据库下表的任意权限将自动关联该数据库目录的HDFS权限。为了避免产生性能问题，取消表的任意权限，系统不会自动取消数据库目录的HDFS权限，但对应的用户只能登录数据库和查看表名。如果为角色添加或删除数据库的查询权限，数据库中的表也将自动添

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

Records处理：为了使数据处理应用程序为用户增值，不可避免地需要对数据进行某种程度的集成。在大多数情况下，数据质量问题源于生成源数据的上游（主要）系统。有两种完全不同的方式处理Bad Data：按照原始数据加载所有数据，之后进行除错处理。在进入数据源的过程中，可以清理或擦除Bad Data，或者在发现Bad

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
调测OpenTSDB应用 - MapReduce服务 MRS

在弹性云服务管理控制台，创建一个新的弹性云服务器。弹性云服务器的“可用分区”、“虚拟私有云”、“安全组”，需要和待访问集群的配置相同。选择一个Windows系统的公共镜像。其他配置参数详细信息，请参见“弹性云服务器 > 快速入门 > 购买并登录Windows弹性云服务器” 使用本机访问MRS集群

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > 调测OpenTSDB应用 > 在Windows中调测程序

总条数： 3561

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

快速开发Hive JDBC应用 - MapReduce服务 MRS

退服和入服MRS角色实例 - MapReduce服务 MRS

查看HDFS容量状态 - MapReduce服务 MRS

创建Hive用户自定义函数 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

配置ClickHouse通过Kerberos认证对接Kafka - MapReduce服务 MRS

离线数据加载：通过StreamLoad将本地CSV文件导入Doris - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

开源sqoop-shell工具使用指导 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

常用参数 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

修改集群服务配置参数 - MapReduce服务 MRS

MapReduce REST API接口介绍 - MapReduce服务 MRS

配置Spark表、列和数据库的用户权限 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

调测OpenTSDB应用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线