搜索_华为云

Spark应用开发简介 - MapReduce服务 MRS

/join并为一个，不但减少了大量的全局barrier，而且无需物化很多中间结果RDD，这将极大地提升性能。Spark把这个叫做流水线（pipeline）优化。 Transformation和Action（RDD的操作）对RDD的操作包含Transformation（返回值还是

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

P服务器的配置信息。表1 连接参数参数名说明示例名称 SFTP服务器连接的名称。 sftpName Sftp服务器的IP SFTP服务器的IP地址。 10.16.0.1 Sftp服务器端口 SFTP服务器的端口号。 22 Sftp用户名访问SFTP服务器的用户名。 root

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
使用Flume服务端从本地采集动态日志保存到HDFS - MapReduce服务 MRS

数据写入HDFS后文件名的前缀。 TMP_ hdfs.batchSize 一次写入HDFS的最大事件数目。 61200 hdfs.kerberosPrincipal kerberos认证时用户，在安全版本下必须填写。安全集群需要配置此项，普通模式集群无需配置。 flume_hdfs hdfs.kerberosKeytab

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume非加密传输数据采集任务
读取Hudi cow表视图 - MapReduce服务 MRS

load("/tmp/default/cow_bugx/") // 指定读取的hudi表路径 .createTempView("mycall") // 注册为spark临时表 spark.sql("select * from mycall where `_hoodie_commit_time`>'20210308211131'")

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi读操作
读取Hudi cow表视图 - MapReduce服务 MRS

load("/tmp/default/cow_bugx/") // 指定读取的hudi表路径 .createTempView("mycall") // 注册为spark临时表 spark.sql("select * from mycall where `_hoodie_commit_time`

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi读操作
使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

迁移效率高：基于分布式计算框架进行数据任务执行和数据传输优化，并针对特定数据源写入做了专项优化，迁移效率高。实时监控：迁移过程中可以执行自动实时监控、告警和通知操作。约束与限制搬迁数据量较大时，对网络通信要求较高，执行搬迁任务时，可能会影响其他业务，建议在业务空闲期进行数据迁移任务。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

P服务器的配置信息。表1 连接参数参数名说明示例名称 SFTP服务器连接的名称。 sftpName Sftp服务器的IP SFTP服务器的IP地址。 10.16.0.1 Sftp服务器端口 SFTP服务器的端口号。 22 Sftp用户名访问SFTP服务器的用户名。 root

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
CarbonData性能调优常见配置参数 - MapReduce服务 MRS

ta将使用YARN本地目录进行多表加载磁盘负载平衡，以提高数据加载性能。表5 加载时是否使用多路径参数 carbon.use.multiple.temp.dir 所属配置文件 carbon.properties 适用于数据加载场景描述是否使用多个临时目录存储sort临时文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
CarbonData性能调优常见配置参数 - MapReduce服务 MRS

ta将使用YARN本地目录进行多表加载磁盘负载平衡，以提高数据加载性能。表5 加载时是否使用多路径参数 carbon.use.multiple.temp.dir 所属配置文件 carbon.properties 适用于数据加载场景描述是否使用多个临时目录存储sort临时文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

'SAUDI ARABIA' join lineitem l on s.s_suppkey = l.l_suppkey where l.l_receiptdate > l.l_commitdate and l.l_orderkey is not null ) l1 on o.o_orderkey

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

'SAUDI ARABIA' join lineitem l on s.s_suppkey = l.l_suppkey where l.l_receiptdate > l.l_commitdate and l.l_orderkey is not null ) l1 on o.o_orderkey

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
状态码 - MapReduce服务 MRS
状态码 - MapReduce服务 MRS

Reset Content 重置内容，服务器处理成功。 206 Partial Content 服务器成功处理了部分GET请求。 300 Multiple Choices 多种选择。请求的资源可包括多个位置，相应可返回一个资源特征与地址的列表用于用户终端（例如：浏览器）选择。 301 Moved

帮助中心 > MapReduce服务 MRS > API参考 > 附录
ALM-14011 HDFS DataNode数据目录配置不合理（2.x及以前版本） - MapReduce服务 MRS

同一磁盘时，系统产生此告警。当修改DataNode的数据目录合理后，重启该DataNode，告警清除。告警属性告警ID 告警级别可自动清除 14011 严重是告警参数参数名称参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark Python API接口介绍 - MapReduce服务 MRS

RY_AND_DISK）等。 pyspark.sql.SQLContext：是SparkSQL功能的主入口。可用于创建DataFrame，注册DataFrame为一张表，表上执行SQL等。 pyspark.sql.DataFrame：分布式数据集。DataFrame等效于Spar

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

RY_AND_DISK）等。 pyspark.sql.SQLContext：是SparkSQL功能的主入口。可用于创建DataFrame，注册DataFrame为一张表，表上执行SQL等。 pyspark.sql.DataFrame：分布式数据集。DataFrame等效于Spar

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

RY_AND_DISK）等。 pyspark.sql.SQLContext：是SparkSQL功能的主入口。可用于创建DataFrame，注册DataFrame为一张表，表上执行SQL等。 pyspark.sql.DataFrame：分布式数据集。DataFrame等效于Spar

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python接口介绍 - MapReduce服务 MRS

RY_AND_DISK）等。 pyspark.sql.SQLContext：是SparkSQL功能的主入口。可用于创建DataFrame，注册DataFrame为一张表，表上执行SQL等。 pyspark.sql.DataFrame：分布式数据集。DataFrame等效于Spar

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark Python API接口介绍 - MapReduce服务 MRS

RY_AND_DISK）等。 pyspark.sql.SQLContext：是SparkSQL功能的主入口。可用于创建DataFrame，注册DataFrame为一张表，表上执行SQL等。 pyspark.sql.DataFrame：分布式数据集。DataFrame等效于Spar

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
使用MRS Spark SQL访问DWS表 - MapReduce服务 MRS

”、“安全组”配置相同。前提条件已创建DWS集群，请参考创建GaussDB(DWS)集群。已获取连接GaussDB(DWS)数据库的IP地址、端口、数据库名称、用户名和密码。此外，操作用户必须具有GaussDB(DWS)表的读写权限。步骤一：创建MRS集群创建MRS集群。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
MapReduce统计样例代码 - MapReduce服务 MRS

Configuration conf = new Configuration(); // 安全登录。 LoginUtil.login(PRINCIPAL, KEYTAB, KRB, conf); // 获取入参。 String[] otherArgs = new Ge

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式） > 开发MapReduce应用 > MapReduce统计样例程序

总条数： 3306

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark应用开发简介 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

使用Flume服务端从本地采集动态日志保存到HDFS - MapReduce服务 MRS

读取Hudi cow表视图 - MapReduce服务 MRS

读取Hudi cow表视图 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

CarbonData性能调优常见配置参数 - MapReduce服务 MRS

CarbonData性能调优常见配置参数 - MapReduce服务 MRS

多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

状态码 - MapReduce服务 MRS

ALM-14011 HDFS DataNode数据目录配置不合理（2.x及以前版本） - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

使用MRS Spark SQL访问DWS表 - MapReduce服务 MRS

MapReduce统计样例代码 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线