搜索_华为云

schedule-tool工具使用指导 - MapReduce服务 MRS

schedule-tool工具使用指导概述 schedule-tool工具，用于提交数据源为SFTP的作业。提交作业前可以修改输入路径、文件过滤条件，当目标源为HDFS时，可以修改输出路径。参数说明表1 schedule.properties配置参数说明配置参数说明示例

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
配置Yarn大作业扫描 - MapReduce服务 MRS

配置Yarn大作业扫描 Yarn大作业扫描功能主要用于监控Hive、HetuEngine、Spark等作业的本地临时文件（例如shuffle文件是否过大）、监控Hive、HetuEngine、Spark的关键HDFS目录（不支持OBS）是否过大。对于占用存储资源（本地磁盘或者关键HDFS目录）过大的作业上报事件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn运维管理
分布式Scan HBase表 - MapReduce服务 MRS

aseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。使用特定的规则扫描Hbase表。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
schedule-tool工具使用指导 - MapReduce服务 MRS

schedule-tool工具使用指导概述 schedule-tool工具，用于提交数据源为SFTP的作业。提交作业前可以修改输入路径、文件过滤条件，当目标源为HDFS时，可以修改输出路径。本章节适用于MRS 3.x及后续版本。参数说明表1 schedule.properties配置参数说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
分布式Scan HBase表 - MapReduce服务 MRS

方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的hbase数据表。开发思路设置scan的规则，例如：setCaching。使用特定的规则扫描Hbase表。运行前置操作安全模式下Spark Core样例代码需要读取两个文件（user

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
schedule-tool工具使用示例 - MapReduce服务 MRS

schedule-tool工具使用示例操作场景通过Loader WebUI或客户端工具Loader-tool创建好作业后，可使用schedule-tool工具执行作业。本章节适用于MRS 3.x及后续版本。前提条件完成了Loader客户端的安装与配置，具体操作请参见使用命令行运行Loader作业。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
schedule-tool工具使用示例 - MapReduce服务 MRS

schedule-tool工具使用示例操作场景通过Loader WebUI或客户端工具Loader-tool创建好作业后，可使用schedule-tool工具执行作业。前提条件完成了Loader客户端的安装与配置，具体操作请参见使用客户端运行Loader作业。操作步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
分布式Scan HBase表 - MapReduce服务 MRS

aseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。使用特定的规则扫描Hbase表。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
分布式Scan HBase表 - MapReduce服务 MRS

方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的hbase数据表。开发思路设置scan的规则，例如：setCaching。使用特定的规则扫描Hbase表。运行前置操作安全模式下Spark Core样例代码需要读取两个文件（user

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
使用TableIndexer工具生成HBase本地二级索引 - MapReduce服务 MRS

使用TableIndexer工具生成HBase本地二级索引场景介绍为了快速对数据创建索引，HBase提供了可通过MapReduce功能创建索引的TableIndexer工具，该工具可实现添加、构建和删除索引。具体使用场景如下：在表中预先存在大量数据的情况下，可能希望在某个列

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
开源sqoop-shell工具使用指导 - MapReduce服务 MRS

开源sqoop-shell工具使用指导概述 sqoop-shell是一个开源的shell工具，其所有功能都是通过执行脚本“sqoop2-shell”来实现的。 sqoop-shell工具提供了如下功能：支持创建和更新连接器支持创建和更新作业支持删除连接器和作业支持以同步或异步的方式启动作业

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Spark小文件合并工具说明工具介绍在Hadoop大规模生产集群中，由于HDFS的元数据都保存在NameNode的内存中，集群规模受制于NameNode单点的内存限制。如果HDFS中有大量的小文件，会消耗NameNode大量内存，还会大幅降低读写性能，延长作业运行时间。因

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
loader-tool工具使用指导 - MapReduce服务 MRS

loader-tool工具使用指导概述 loader-tool工具是Loader客户端工具之一，包括“lt-ucc”、“lt-ucj”、“lt-ctl”三个工具。 Loader支持通过参数选项或作业模板这两种方式，对连接器进行创建、更新、查询和删除，以及对Loader作业进行创

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
使用TableIndexer工具生成HBase本地二级索引 - MapReduce服务 MRS

使用TableIndexer工具生成HBase本地二级索引场景介绍为了快速对数据创建索引，HBase提供了可通过MapReduce功能创建索引的TableIndexer工具，该工具可实现添加、构建和删除索引。具体使用场景如下：在表中预先存在大量数据的情况下，可能希望在某个列

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
loader-tool工具使用指导 - MapReduce服务 MRS

loader-tool工具使用指导概述 loader-tool工具是Loader客户端工具之一，包括“lt-ucc”、“lt-ucj”、“lt-ctl”三个工具。 Loader支持通过参数选项或作业模板这两种方式，对连接器进行创建、更新、查询和删除，以及对Loader作业进行创

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

from test where b=xxx 原因分析按照设定，任务应该只扫描b=xxx的分区，但是查看任务日志可以发现，实际上任务却扫描了所有的分区再来计算b=xxx的数据，因此任务计算的很慢。并且因为需要扫描所有文件，会有大量的OBS请求发送。 MRS默认开启基于分区统计信息的执

 帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
ALM-12187 磁盘分区扩容失败 - MapReduce服务 MRS

使用root用户登录告警上报主机IP节点。执行以下命令检测磁盘分区growpart扩容工具是否存在。 which growpart 回显类似如下说明工具存在，否则请联系运维人员安装growpart工具。 [root@xxx ~]#which growpart /usr/bin/growpart

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Spark小文件合并工具说明工具介绍在Hadoop大规模生产集群中，由于HDFS的元数据都保存在NameNode的内存中，集群规模受制于NameNode单点的内存限制。如果HDFS中有大量的小文件，会消耗NameNode大量内存，还会大幅降低读写性能，延长作业运行时间。因

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率操作场景 Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤 MRS 3.x之前版本：登录MRS控制台，在左侧导航栏选择“现有集群”，单击集群名称。选择“节点管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率操作场景 Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤以root用户登录已安装Hive客户端的节点。执行以下命令，进入客

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优

总条数： 721

上一页
1
2
3
4
5
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

schedule-tool工具使用指导 - MapReduce服务 MRS

配置Yarn大作业扫描 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

schedule-tool工具使用指导 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

schedule-tool工具使用示例 - MapReduce服务 MRS

schedule-tool工具使用示例 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

使用TableIndexer工具生成HBase本地二级索引 - MapReduce服务 MRS

开源sqoop-shell工具使用指导 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

loader-tool工具使用指导 - MapReduce服务 MRS

使用TableIndexer工具生成HBase本地二级索引 - MapReduce服务 MRS

loader-tool工具使用指导 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

ALM-12187 磁盘分区扩容失败 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线