搜索_华为云

Spark SQL样例程序（Python） - MapReduce服务 MRS

int(dataArr[2])))\ .collect() df = sqlCtx.createDataFrame(inputRDD) # 注册表 df.registerTempTable("FemaleInfoTable") # 执行SQL查询并显示结果

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
Spark SQL样例程序（Python） - MapReduce服务 MRS

int(dataArr[2])))\ .collect() df = sqlCtx.createDataFrame(inputRDD) # 注册表 df.registerTempTable("FemaleInfoTable") # 执行SQL查询并显示结果

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
SET/RESET - MapReduce服务 MRS
SET/RESET - MapReduce服务 MRS

segments. <database_name>. <table_name> = < list of segment ids >” 如果用户想在多线程模式下查询指定段，可使用CarbonSession.threadSet代替SET语句。语法： “CarbonSession.threadSet

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
设置Spark Core并行度 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
Spark任务提交失败 - MapReduce服务 MRS

常见的场景是使用--files上传了user.keytab，然后使用--keytab又指定了同一个文件，导致一个文件多次被上传。处理步骤问题1：重新kinit一个用户并修改相应的配置参数。问题2：查看hadoop相关的配置项是否正确，查看spark的conf目录下的core-site.xml，hdfs-site

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
Spark SQL样例程序（Python） - MapReduce服务 MRS

int(dataArr[2])))\ .collect() df = sqlCtx.createDataFrame(inputRDD) # 注册表 df.registerTempTable("FemaleInfoTable") # 执行SQL查询并显示结果

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
Spark SQL样例程序（Python） - MapReduce服务 MRS

int(dataArr[2])))\ .collect() df = sqlCtx.createDataFrame(inputRDD) # 注册表 df.registerTempTable("FemaleInfoTable") # 执行SQL查询并显示结果

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
正则表达式函数 - MapReduce服务 MRS

pattern, function) → varchar 描述：使用function替换与字符串中的正则表达式模式匹配的子字符串的每个实例。对于每个匹配，以数组形式传递的捕获组都会调用lambda表达式函数。捕获组号从1开始；整个匹配没有分组（如果需要，请用括号将整个表达式括起来）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
HDFS日志介绍 - MapReduce服务 MRS
HDFS日志介绍 - MapReduce服务 MRS

HDFS主备倒换运行日志。 hdfs-router-admin.log 管理挂载表操作的运行日志。 threadDump-<DATE>.log 实例进程堆栈日志。 Tomcat日志 hadoop-omm-host1.out，httpfs-catalina.<DATE>.log，httpfs-host-manager

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
设置并行度 - MapReduce服务 MRS
设置并行度 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark SQL样例程序（Java） - MapReduce服务 MRS

return femaleInfo; } }); // 注册表。 Dataset<ROW> schemaFemaleInfo = spark.createDataFrame(femaleInfoJavaRDD

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
HDFS日志介绍 - MapReduce服务 MRS
HDFS日志介绍 - MapReduce服务 MRS

HDFS主备倒换运行日志。 hdfs-router-admin.log 管理挂载表操作的运行日志。 threadDump-<DATE>.log 实例进程堆栈日志。 Tomcat日志 hadoop-omm-host1.out，httpfs-catalina.<DATE>.log，httpfs-host-manager

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

over inner join、aggregate over union all等。为应对不同应用场景的特殊需求，对所有下推模块设计开关功能，用户可以自行配置是否应用上述查询下推的增强。表1 跨源查询增加特性对比模块增强前增强后 aggregate 不支持aggregate下推

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
修改CarbonData Table - MapReduce服务 MRS

TBLPROPERTIES('SORT_COLUMNS'='column1') 在执行该命令后，新的导入会使用新的SORT_COLUMNS配置值。用户可以根据查询的情况来调整SORT_COLUMNS，但是不会直接影响旧的数据。所以对历史的segments的查询性能不会受到影响，因为历史的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData数据分析
spark-shell执行SQL跨文件系统load数据到Hive表失败 - MapReduce服务 MRS

spark-shell执行SQL跨文件系统load数据到Hive表失败用户问题使用spark-shell命令执行SQL或者spark-submit提交的Spark任务里面有SQL的load命令，并且原数据和目标表存储位置不是同一套文件系统，上述两种方式MapReduce任务启动时会报错。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
Spark Core内存调优 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Kafka应用开发简介 - MapReduce服务 MRS

topic中获取消息的角色称为Consumer。 Broker Kafka集群中的每一个节点服务器称为Broker。 keytab file 存放用户信息的密钥文件。应用程序采用此密钥文件在集群中进行API方式认证。父主题： Kafka开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式）
Spark SQL样例程序（Java） - MapReduce服务 MRS

return femaleInfo; } }); // 注册表。 Dataset<ROW> schemaFemaleInfo = spark.createDataFrame(femaleInfoJavaRDD

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
Kafka应用开发简介 - MapReduce服务 MRS

topic中获取消息的角色称为Consumer。 Broker Kafka集群中的每一个节点服务器称为Broker。 keytab file 存放用户信息的密钥文件。应用程序采用此密钥文件在集群中进行API方式认证。父主题： Kafka开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式）
Kafka应用开发简介 - MapReduce服务 MRS

Topic中获取消息的角色称为Consumer。 Broker Kafka集群中的每一个节点服务器称为Broker。 keytab file 存放用户信息的密钥文件。应用程序采用此密钥文件在集群中进行API方式认证。父主题： Kafka开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（安全模式）

总条数： 5462

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL样例程序（Python） - MapReduce服务 MRS

Spark SQL样例程序（Python） - MapReduce服务 MRS

SET/RESET - MapReduce服务 MRS

设置Spark Core并行度 - MapReduce服务 MRS

Spark任务提交失败 - MapReduce服务 MRS

Spark SQL样例程序（Python） - MapReduce服务 MRS

Spark SQL样例程序（Python） - MapReduce服务 MRS

正则表达式函数 - MapReduce服务 MRS

HDFS日志介绍 - MapReduce服务 MRS

设置并行度 - MapReduce服务 MRS

Spark SQL样例程序（Java） - MapReduce服务 MRS

HDFS日志介绍 - MapReduce服务 MRS

Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

修改CarbonData Table - MapReduce服务 MRS

spark-shell执行SQL跨文件系统load数据到Hive表失败 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

Spark SQL样例程序（Java） - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线