搜索_华为云

使用活动缓存提升HDFS客户端连接性能 - MapReduce服务 MRS

件上的锁定，则放弃尝试读取或更新缓存。单位为秒。 5 由HDFS客户端创建的缓存文件必须由其他客户端重新使用。因此，这些文件永远不会从本地系统中删除。若禁用该功能，可能需要进行手动清理。父主题： HDFS性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS性能调优
通过JDBC访问Spark SQL样例程序开发思路 - MapReduce服务 MRS

除。数据规划将数据文件上传至HDFS中。确保以多主实例模式启动了JDBCServer服务，并至少有一个实例可连接客户端。在Linux系统HDFS客户端新建一个文本文件“data”，内容如下： Miranda,32 Karlie,23 Candice,27 在HDFS路径下建

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > 通过JDBC访问Spark SQL样例程序
配置Hive读取关系型数据库 - MapReduce服务 MRS

dbcp.username" = "test", -- 关系型数据库密码，命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。 "qubit.sql.dbcp.password" = "xxx"); 如果是安全模式，建表的用户需要“ADMIN”权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
使用Oozie客户端提交其它任务 - MapReduce服务 MRS

执行完工作流文件，显示job id表示提交成功，例如：job: 0000021-140222101051722-oozie-omm-W。登录Oozie管理页面，查看运行情况。使用oozieuser用户，登录Oozie WebUI页面：https://oozie角色的ip地址:21003/oozie

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Oozie客户端提交作业
Spark Python API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

确认MRS集群是否开启了Kerberos认证。是，执行3。否，执行步骤2：安装Python3。登录集群的Manager界面。单击“系统 > 权限 > 用户”，创建一个业务用户。用户类型为人机用户，用户组选择“hadoop”，主组选择“hadoop”，角色选择“Manager_operator”。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
Spark Python API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
配置ClickHouse通过Kerberos认证对接Kafka - MapReduce服务 MRS

登录Kafka服务所在集群的Manager页面，选择“系统 > 权限 > 用户 > 添加用户”，创建一个具有Kafka权限的用户，例如创建机机用户ck_user1。Kafka用户权限介绍请参考Kafka用户权限说明。选择“系统 > 权限 > 用户”，在用户名中选择ck_user1，单击操作列的“更多

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入 > 配置ClickHouse对接Kafka
配置矢量化读取ORC数据 - MapReduce服务 MRS

impl”：指定使用Hive还是Spark SQL native作为SQL执行引擎来读取ORC数据，默认为hive。配置参数登录FusionInsight Manager系统，选择“集群 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。参数说明默认值取值范围 spark.sql

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
配置NameNode黑名单功能 - MapReduce服务 MRS

client实例都会尝试再次连接NameNode，导致应用长时间等待超时。当位于同一JVM进程中的客户端对无法访问的NameNode进行连接时，会对系统造成负担。为了避免这种负担，MRS集群搭载了NameNode blacklist功能。在新的Blacklisting DFSClient

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
配置矢量化读取ORC数据 - MapReduce服务 MRS

impl”：指定使用Hive还是Spark SQL native作为SQL执行引擎来读取ORC数据，默认为hive。配置参数登录FusionInsight Manager系统，选择“集群 > 待操作集群的名称 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。参数说明默认值取值范围

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

点磁盘可用空间块放置策略”，可提高将块数据写到磁盘可用空间较大节点的概率，解决因为数据节点磁盘容量不一致导致的节点使用率不均衡的情况。对系统的影响修改磁盘选择策略为“节点磁盘可用空间块放置策略（org.apache.hadoop.hdfs.server.blockmanagement

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS企业级能力增强
配置Hive读取关系型数据库数据 - MapReduce服务 MRS

dbcp.username" = "test", -- 关系型数据库密码，命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。 "qubit.sql.dbcp.password" = "xxx"); 父主题：使用Hive

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive
配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

点磁盘可用空间块放置策略”，可提高将块数据写到磁盘可用空间较大节点的概率，解决因为数据节点磁盘容量不一致导致的节点使用率不均衡的情况。对系统的影响修改磁盘选择策略为“节点磁盘可用空间块放置策略（org.apache.hadoop.hdfs.server.blockmanagement

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
什么是区域和可用区？ - MapReduce服务 MRS

火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。图1表示区域和可用区之间的关系。图1 区域和可用区目前，华为云已在全球多个地域开放云服务，您可以根据需求选择适合自己的区域和可用区。更多信息请参见华为云全球站点。

帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
Spark Python API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path, compressionCodecClass) 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path, compressionCodecClass=None)

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Geospatial函数 - MapReduce服务 MRS
Geospatial函数 - MapReduce服务 MRS

text)是开放地理空间联盟OGC（Open GIS Consortium ）制定的一种文本标记语言，用于表示矢量几何对象、空间参照系统及空间参照系统之间的转换。 WKB(well-known binary) 是WKT的二进制表示形式，解决了WKT表达方式冗余的问题，便于传输和在数据库中存储相同的信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
开源sqoop-shell工具使用指导 - MapReduce服务 MRS

命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。通过Kerberos模式认证： ./sqoop2-shell -uk true -k user.keytab -s userPrincipal 系统显示如下信息： Welcome to sqoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
使用MySQL客户端连接Doris - MapReduce服务 MRS

包，建议安装8.x版本，以Red Hat发行版本为例：如果2的依赖库是6.x建议下载对应OS Version为Red Hat 8的MySQL软件包。如果2的依赖库是5.x建议下载对应OS Version为Red Hat 7的MySQL软件包。例如需安装的MySQL 8.0.22客户端需下载如下四个软件包：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris
配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

ger进行升级，这些NodeManager会获得新版本的软件。这导致了行为的不一致，并可能发生运行时错误。同时存在多个Yarn版本集群管理员可能会在一个集群内运行使用多个版本Yarn及Hadoop jars的任务。这在当前很难实现，因为jars已被本地化且只有一个版本。 Ma

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce

总条数： 3141

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用活动缓存提升HDFS客户端连接性能 - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序开发思路 - MapReduce服务 MRS

配置Hive读取关系型数据库 - MapReduce服务 MRS

使用Oozie客户端提交其它任务 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

配置ClickHouse通过Kerberos认证对接Kafka - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置NameNode黑名单功能 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

配置Hive读取关系型数据库数据 - MapReduce服务 MRS

配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

什么是区域和可用区？ - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Geospatial函数 - MapReduce服务 MRS

开源sqoop-shell工具使用指导 - MapReduce服务 MRS

使用MySQL客户端连接Doris - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线