搜索_华为云

LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

Records处理：为了使数据处理应用程序为用户增值，不可避免地需要对数据进行某种程度的集成。在大多数情况下，数据质量问题源于生成源数据的上游（主要）系统。有两种完全不同的方式处理Bad Data：按照原始数据加载所有数据，之后进行除错处理。在进入数据源的过程中，可以清理或擦除Bad Data，或者在发现Bad

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
添加HBase数据源 - MapReduce服务 MRS

”文件中，添加待对接数据源所在集群的主机名称和对应的IP映射，及其“/etc/hosts”文件中的“10.10.10.10 hadoop.系统域名”（如“10.10.10.10 hadoop.hadoop.com”），否则HetuEngine无法根据主机名称连接到非本集群节点。已创建HetuEngine计算实例。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Spark常用配置参数 - MapReduce服务 MRS

（仅hash方式）如果要合并在shuffle过程中创建的中间文件，需要将该值设置为“true”。文件创建的少可以提高文件系统处理性能，降低风险。使用ext4或者xfs文件系统时，建议设置为“true”。由于文件系统限制，在ext3上该设置可能会降低8核以上机器的处理性能。 false spark.shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Storm-OBS开发指引 - MapReduce服务 MRS

.withFieldDelimiter("|"); // 同步策略，每1000个tuple对文件系统进行一次同步 // HdfsBolt必选参数 SyncPolicy syncPolicy = new Co

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > Storm应用开发常见问题
自动续费 - MapReduce服务 MRS
自动续费 - MapReduce服务 MRS

开通自动续费后，还可以手动续费该MRS集群。手动续费后，自动续费仍然有效，在新的到期时间前的第7天开始扣款。自动续费的到期前7日自动扣款属于系统默认配置，您也可以根据需要修改此扣款日，如到期前6日、到期前5日等。本章节主要介绍如何开通包年/包月MRS集群的自动续费功能，更多自动续费相关操作请参见自动续费。

帮助中心 > MapReduce服务 MRS > 计费说明 > 续费
元数据导出 - MapReduce服务 MRS
元数据导出 - MapReduce服务 MRS

<table_name>：待导出的表名称。 <user>：用户名。 <passwd>：用户密码。命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。父主题：数据迁移方案介绍

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移 > 数据迁移方案介绍
Oozie - MapReduce服务 MRS
Oozie - MapReduce服务 MRS

作。 SDK 软件开发工具包SDK（SoftwareDevelopmentKit）是被软件工程师用于为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件的开发工具的集合。 Database pg数据库。 WebApp（Oozie） WebApp（Oozie）即Oozie s

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
ZooKeeper与其他组件的关系 - MapReduce服务 MRS

备切换。 ZooKeeper和YARN的关系 ZooKeeper与YARN的关系如图2所示。图2 ZooKeeper与YARN的关系在系统启动时，ResourceManager会尝试把选举信息写入ZooKeeper，第一个成功写入ZooKeeper的ResourceManager被选举为Active

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ZooKeeper
配置NameNode黑名单功能 - MapReduce服务 MRS

client实例都会尝试再次连接NameNode，导致应用长时间等待超时。当位于同一JVM进程中的客户端对无法访问的NameNode进行连接时，会对系统造成负担。为了避免这种负担，MRS集群搭载了NameNode blacklist功能。在新的Blacklisting DFSClient

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS企业级能力增强
使用活动缓存提升HDFS客户端连接性能 - MapReduce服务 MRS

件上的锁定，则放弃尝试读取或更新缓存。单位为秒。 5 由HDFS客户端创建的缓存文件必须由其他客户端重新使用。因此，这些文件永远不会从本地系统中删除。若禁用该功能，可能需要进行手动清理。父主题： HDFS性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS性能调优
配置YARN-Client和YARN-Cluster不同模式下的环境变量 - MapReduce服务 MRS

extraLibraryPath”。不添加表1中配置项时，使用方式与原有方式一致，程序可正常执行，只是在不同模式下需切换配置。配置参数参数入口：在Manager系统中，选择“集群 > 待操作集群的名称 > 服务 > Spark2x > 配置”，单击“全部配置”，在搜索框中输入参数名称。表1 参数介绍

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
使用活动缓存提升HDFS客户端连接性能 - MapReduce服务 MRS

件上的锁定，则放弃尝试读取或更新缓存。单位为秒。 5 由HDFS客户端创建的缓存文件必须由其他客户端重新使用。因此，这些文件永远不会从本地系统中删除。若禁用该功能，可能需要进行手动清理。父主题： HDFS性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
配置YARN-Client和YARN-Cluster不同模式下的环境变量 - MapReduce服务 MRS

extraLibraryPath”。不添加表1中配置项时，使用方式与原有方式一致，程序可正常执行，只是在不同模式下需切换配置。配置参数参数入口：在Manager系统中，选择“集群 > 服务 > Spark2x > 配置”，单击“全部配置”，在搜索框中输入参数名称。表1 参数介绍参数描述默认值 spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Spark Python API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
查看HDFS容量状态 - MapReduce服务 MRS

ameNode文件对象总量增加，需要消耗更多的内存，使集群现有硬件可能会难以满足业务需求，且导致集群难以扩展。规划存储大量文件的HDFS系统容量，就是规划NameNode的容量规格和DataNode的容量规格，并根据容量设置参数。容量规格以下相关参数可以参考修改集群服务配置

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
创建Hive用户自定义函数 - MapReduce服务 MRS

集群属性”，查看集群的“认证模式”并记录。选择“集群 > 服务 > Hive”，单击页面右上角的“更多”查看Hive是否启用Ranger鉴权。选择“系统 > 权限 > 用户”，单击“添加用户”，配置以下参数并单击“确定”，创建执行自定义函数的用户：用户名：填写用户名称，例如：test。用户类型：选择“人机”用户。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

Receiver将数据流分成一系列小块，存储到Executor内存中。另外，在启用预写日志（Write-ahead Log，简称WAL）以后，数据同时还写入到容错文件系统的预写日志中。通知Driver（绿色箭头）接收块中的元数据（Metadata）被发送到Driver的StreamingContext。这个元数据包括：

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
开源sqoop-shell工具使用指导 - MapReduce服务 MRS

命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。通过Kerberos模式认证： ./sqoop2-shell -uk true -k user.keytab -s userPrincipal 系统显示如下信息： Welcome to sqoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
常用参数 - MapReduce服务 MRS
常用参数 - MapReduce服务 MRS

（仅hash方式）若要合并在shuffle过程中创建的中间文件，需要将该值设置为“true”。文件创建的少可以提高文件系统处理性能，降低风险。使用ext4或者xfs文件系统时，建议设置为“true”。由于文件系统限制，在ext3上该设置可能会降低8核以上机器的处理性能。 false spark.shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理

总条数： 2399

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LOAD DATA - MapReduce服务 MRS

添加HBase数据源 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

Storm-OBS开发指引 - MapReduce服务 MRS

自动续费 - MapReduce服务 MRS

元数据导出 - MapReduce服务 MRS

Oozie - MapReduce服务 MRS

ZooKeeper与其他组件的关系 - MapReduce服务 MRS

配置NameNode黑名单功能 - MapReduce服务 MRS

使用活动缓存提升HDFS客户端连接性能 - MapReduce服务 MRS

配置YARN-Client和YARN-Cluster不同模式下的环境变量 - MapReduce服务 MRS

使用活动缓存提升HDFS客户端连接性能 - MapReduce服务 MRS

配置YARN-Client和YARN-Cluster不同模式下的环境变量 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

查看HDFS容量状态 - MapReduce服务 MRS

创建Hive用户自定义函数 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

开源sqoop-shell工具使用指导 - MapReduce服务 MRS

常用参数 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线