搜索_华为云

Spark SQL样例程序（Python） - MapReduce服务 MRS

SparkSQLPythonExample.py <file>" exit(-1) # 初始化SparkSession和SQLContext sc = SparkSession.builder.appName("CollectFemaleInfo").getOrCreate()

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
使用广播变量 - MapReduce服务 MRS

变得很大。每个任务分片在执行中都需要同一份数据集合时，就可以把公共数据集Broadcast到每个节点，让每个节点在本地都保存一份。大表和小表做join操作时可以把小表Broadcast到各个节点，从而就可以把join操作转变成普通的操作，减少了shuffle操作。操作步骤

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark SQL样例程序（Python） - MapReduce服务 MRS

SparkSQLPythonExample.py <file>" exit(-1) # 初始化SparkSession和SQLContext sc = SparkSession.builder.appName("CollectFemaleInfo").getOrCreate()

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
概述 - MapReduce服务 MRS
概述 - MapReduce服务 MRS

赖区分列是否有创建索引。 mysql-fastpath-connector：MySQL数据库专用连接器，使用MySQL的mysqldump和mysqlimport工具进行数据的导入导出，相对generic-jdbc-connector来说，导入导出速度更快。 sftp-connector：SFTP数据源连接器。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
创建CarbonData Table的建议 - MapReduce服务 MRS

为常用的过滤列创建索引。例如，如果msname，host和dime_1是过滤经常使用的列，根据cardinality，sort_columns列的顺序是dime_1-> host-> msname…。创建表命令如下，以下命令可提高dime_1，host和msname上的过滤性能。 create table

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
Sqoop常用命令及参数介绍 - MapReduce服务 MRS

在控制台打印详细信息 import参数 --fields-terminated-by 设定字段分隔符，和Hive表或hdfs文件保持一致 --lines-terminated-by 设定行分隔符，和hive表或hdfs文件保持一致 --mysql-delimiters MySQL默认分隔符设置

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
导入并配置Hive JDBC样例工程 - MapReduce服务 MRS

目录下的样例工程文件夹“hive-jdbc-example”。将准备MRS应用开发用户时得到的keytab文件“user.keytab”和“krb5.conf”文件放到样例工程的“hive-jdbc-example\src\main\resources”目录下。进入客户端解压

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
ALM-19015 在ZooKeeper上的数量配额使用率超过阈值 - MapReduce服务 MRS

HBase配置了容灾并且容灾存在数据同步失败或者同步速度慢； HBase集群存在大量的WAL文件在进行split。处理步骤检查znode数量配额和使用量在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，选中“告警ID”为“19015”的告警，查看“附加信息”中的阈值。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
在ResourceManager重启后，应用程序会移回原来的队列 - MapReduce服务 MRS

储新队列的信息。假设用户提交一个MR任务到叶子队列test11上。当任务运行时，删除叶子队列test11，这时提交队列自动变为lost_and_found队列（找不到队列的任务会被放入lost_and_found队列中），任务暂停运行。要启动该任务，用户将任务移动到叶子队列te

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn常见问题
配置HDFS文件回收站机制 - MapReduce服务 MRS

站（trash）中，不会被立即清除，以便在误操作的情况下恢复被删除的数据。被删除的文件在超过老化时间后将变为老化文件，会基于系统机制清除或用户手动清除。您可以设置文件保留在回收站中的时间阈值，一旦文件保存时间超过此阈值，将从回收站中永久地删除。如果回收站被清空，回收站中的所有文件将被永久删除。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
ResourceManager重启后，应用程序会移回原来的队列 - MapReduce服务 MRS

储新队列的信息。假设用户提交一个MR任务到叶子队列test11上。当任务运行时，删除叶子队列test11，这时提交队列自动变为lost_and_found队列（找不到队列的任务会被放入lost_and_found队列中），任务暂停运行。要启动该任务，用户将任务移动到叶子队列te

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn常见问题
如何在Hive自定义函数中操作本地文件 - MapReduce服务 MRS

conversion”参数的值为“more”，在UDF中不能再使用相对路径来操作文件，而要使用绝对路径，并且保证所有的HiveServer节点和NodeManager节点上该文件是存在的且omm用户对该文件有相应的权限，才能正常在UDF中操作本地文件。父主题： Hive常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
DELETE RECORDS from CARBON TABLE - MapReduce服务 MRS

示例5： delete from columncarbonTable1 where column2 >= 4; 系统响应可在driver日志和客户端中查看命令运行成功或失败。父主题： DML

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
如何在Hive自定义函数中操作本地文件 - MapReduce服务 MRS

conversion”参数的值为“more”，在UDF中不能再使用相对路径来操作文件，而要使用绝对路径，并且保证所有的HiveServer节点和NodeManager节点上该文件是存在的且omm用户对该文件有相应的权限，才能正常在UDF中操作本地文件。父主题： Hive常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
过滤行转换 - MapReduce服务 MRS
过滤行转换 - MapReduce服务 MRS

条件逻辑为“OR”，如果未添加过滤条件，全部数据成为脏数据；或者原始数据满足任意添加的过滤条件，当前行成为脏数据。样例通过“CSV文件输入”算子，生成两个字段A和B。源文件如下：配置“过滤行转换”算子，过滤掉含有test的行。转换后，输入原字段，结果如下：父主题：转换算子

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 转换算子
过滤行转换 - MapReduce服务 MRS
过滤行转换 - MapReduce服务 MRS

条件逻辑为“OR”，如果未添加过滤条件，全部数据成为脏数据；或者原始数据满足任意添加的过滤条件，当前行成为脏数据。样例通过“CSV文件输入”算子，生成两个字段A和B。源文件如下：配置“过滤行转换”算子，过滤掉含有test的行。转换后，输入原字段，结果如下：父主题： Loader转换类算子

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader转换类算子
为什么创建Hive表失败？ - MapReduce服务 MRS

by子句限制了Hive表的Partition数量。增加distribute by 子句后，最终的输出文件数取决于指定列的cardinality和“spark.sql.shuffle.partitions”参数值。但如果distribute by的字段的cardinality值很小，例如，“spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData常见问题
配置Spark Core广播变量 - MapReduce服务 MRS

变得很大。每个任务分片在执行中都需要同一份数据集合时，就可以把公共数据集Broadcast到每个节点，让每个节点在本地都保存一份。大表和小表做join操作时可以把小表Broadcast到各个节点，从而就可以把join操作转变成普通的操作，减少了shuffle操作。操作步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
使用Spark客户端创建CarbonData表 - MapReduce服务 MRS

onData。创建CarbonData Table 连接到CarbonData之后，需要创建CarbonData table用于加载数据和执行查询操作。加载数据到CarbonData Table 创建CarbonData table之后，可以从CSV文件加载数据到所创建的table中。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData
配置Spark Core广播变量 - MapReduce服务 MRS

变得很大。每个任务分片在执行中都需要同一份数据集合时，就可以把公共数据集Broadcast到每个节点，让每个节点在本地都保存一份。大表和小表做join操作时可以把小表Broadcast到各个节点，从而就可以把join操作转变成普通的操作，减少了shuffle操作。操作步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优

总条数： 5060

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL样例程序（Python） - MapReduce服务 MRS

使用广播变量 - MapReduce服务 MRS

Spark SQL样例程序（Python） - MapReduce服务 MRS

概述 - MapReduce服务 MRS

创建CarbonData Table的建议 - MapReduce服务 MRS

Sqoop常用命令及参数介绍 - MapReduce服务 MRS

导入并配置Hive JDBC样例工程 - MapReduce服务 MRS

ALM-19015 在ZooKeeper上的数量配额使用率超过阈值 - MapReduce服务 MRS

在ResourceManager重启后，应用程序会移回原来的队列 - MapReduce服务 MRS

配置HDFS文件回收站机制 - MapReduce服务 MRS

ResourceManager重启后，应用程序会移回原来的队列 - MapReduce服务 MRS

如何在Hive自定义函数中操作本地文件 - MapReduce服务 MRS

DELETE RECORDS from CARBON TABLE - MapReduce服务 MRS

如何在Hive自定义函数中操作本地文件 - MapReduce服务 MRS

过滤行转换 - MapReduce服务 MRS

过滤行转换 - MapReduce服务 MRS

为什么创建Hive表失败？ - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

使用Spark客户端创建CarbonData表 - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线