搜索_华为云

使用Hue提交提交Bundle批处理作业 - MapReduce服务 MRS

使用Hue提交提交Bundle批处理作业操作场景当同时存在多个定时任务的情况下，用户可以通过Bundle任务进行批量管理作业。该任务指导用户通过Hue界面提交批量类型的作业。前提条件提交Bundle批处理之前需要提前配置好相关的Workflow和Coordinator作业。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Hue提交Oozie作业
设置并行度 - MapReduce服务 MRS
设置并行度 - MapReduce服务 MRS

设置并行度操作场景并行度控制任务的数量，影响shuffle操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到最优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
使用Loader从HDFS导入数据到ClickHouse - MapReduce服务 MRS

':;,中的任意字符。如果设置的作业需要使用指定YARN队列功能，该用户需要已授权有相关YARN队列的权限。设置任务的用户需要获取该任务的执行权限，并获取该任务对应的连接的使用权限。操作步骤设置作业基本信息登录“Loader WebUI”界面。登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
Spark Core内存调优 - MapReduce服务 MRS

Core内存调优操作场景并行度控制任务的数量，影响shuffle操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到合适。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
使用代理用户提交Spark作业 - MapReduce服务 MRS

使用代理用户提交Spark作业本章节仅适用MRS 3.3.0及之后版本。场景说明提交Spark任务时，用户可以使用当前实际运行用户提交任务，也可以使用代理用户提交任务。本章节介绍如何开启代理用户提交任务。前提条件创建用户，登录Manager页面，选择“系统 > 权限 > 用户”，单击

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
配置Spark Core广播变量 - MapReduce服务 MRS

Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。每个任务分片在执行中都需要同一份数据集合时，就

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

在集群运维过程中，排查性能类问题时，可查看集群的事件信息中是否有HDFS磁盘均衡任务事件发生，如果有，可以排查集群中是否开启了DiskBalancer。自动执行磁盘均衡的特性开启以后，会在此次数据均衡执行完成之后才会退出。无法在执行均衡中途取消本次执行任务。如果想要灵活选择某些指定节点进行数据均衡，可以在客户端手动指定执行。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
典型场景：从HDFS导入数据到ClickHouse - MapReduce服务 MRS

':;,中的任意字符。如果设置的作业需要使用指定YARN队列功能，该用户需要已授权有相关YARN队列的权限。设置任务的用户需要获取该任务的执行权限，并获取该任务对应的连接的使用权限。操作步骤设置作业基本信息登录“Loader WebUI”界面。登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
使用Hue提交Bundle批处理作业 - MapReduce服务 MRS

使用Hue提交Bundle批处理作业操作场景当同时存在多个定时任务的情况下，用户可以通过Bundle任务进行批量管理作业。该任务指导用户通过Hue界面提交批量类型的作业。前提条件提交Bundle批处理之前需要提前配置好相关的Workflow和Coordinator作业。操作步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Hue提交Oozie作业
通过JDBC访问Spark SQL样例程序（Java） - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序（Java）功能简介使用自定义客户端的JDBC接口提交数据分析任务，并返回结果。样例代码定义SQL语句。SQL语句必须为单条语句，注意其中不能包含“;”。示例： ArrayList<String> sqlList = new ArrayList<String>();

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > 通过JDBC访问Spark SQL样例程序
通过JDBC访问Spark SQL样例程序（Scala） - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序（Scala）功能简介使用自定义客户端的JDBC接口提交数据分析任务，并返回结果。样例代码定义SQL语句。SQL语句必须为单条语句，注意其中不能包含“;”。示例： val sqlList = new ArrayBuffer[String]

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > 通过JDBC访问Spark SQL样例程序
使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

CDM服务迁移Hadoop数据至MRS集群方案如图1所示。图1 Hadoop数据迁移示意方案优势简单易用：免编程，向导式任务开发界面，通过简单配置几分钟即可完成迁移任务开发。迁移效率高：基于分布式计算框架进行数据任务执行和数据传输优化，并针对特定数据源写入做了专项优化，迁移效率高。实时监控：迁移过程中可以执行自动实时监控、告警和通知操作。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
使用广播变量 - MapReduce服务 MRS

Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。每个任务分片在执行中都需要同一份数据集合时，就

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
配置Spark Core广播变量 - MapReduce服务 MRS

Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。每个任务分片在执行中都需要同一份数据集合时，就

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
典型场景：从关系型数据库导入数据到ClickHouse - MapReduce服务 MRS

导入、导出数据的大小。如果设置的作业需要使用指定YARN队列功能，该用户需要已授权有相关YARN队列的权限。设置任务的用户需要获取该任务的执行权限，并获取该任务对应的连接的使用权限。操作前需要进行如下配置：从MySQL数据库安装路径下获取MySQL客户端jar包（如mysqlclient-5

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
分析Hive数据 - MapReduce服务 MRS
分析Hive数据 - MapReduce服务 MRS

分析Hive数据功能介绍本小节介绍了如何使用样例程序完成分析任务。样例程序主要有以下方式。使用JDBC接口提交数据分析任务。使用HCatalog接口提交数据分析任务。样例代码使用Hive JDBC接口提交数据分析任务，参考样例程序中的JDBCExample.java。定义

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 开发Hive应用
MRS集群Manager简介 - MapReduce服务 MRS

主页右侧可查看集群的不同级别告警个数、运行任务个数、当前用户和帮助信息等内容，如图3所示。图3 集群状态信息单击可查看“任务管理中心”中近100次操作任务的任务名、状态、进度、开始时间和结束时间。对于启动、停止、重启以及滚动重启操作，在任务执行过程中，单击任务列表中的对应任务名称，单击“中止”按

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

Compiler：编译HQL并将其转化为一系列相互依赖的Map/Reduce任务。 Optimizer：优化器，分为逻辑优化器和物理优化器，分别对HQL生成的执行计划和MapReduce任务进行优化。 Executor：按照任务的依赖关系分别执行Map/Reduce任务。 ThriftServer：提供thrif

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Hive客户端使用实践 - MapReduce服务 MRS

query_string”格式的lvy URL，将一个或多个文件、JAR文件或ARCHIVE文件添加至分布式缓存的资源列表中。 list FILE[S] list JAR[S] list ARCHIVE[S] 列出已添加至分布式缓存中的资源。 list FILE[S] <filepath>* list JAR[S]

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
Hudi Compaction操作说明 - MapReduce服务 MRS

inline=true; 更多compaction参数请参考compaction&cleaning配置章节。为了保证入湖的最高效率，推荐使用同步产生compaction调度计划，异步执行compaction调度计划的方式。父主题： Hudi数据管理维护

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护

总条数： 2227

上一页
1
...
24
25
26
...
112
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hue提交提交Bundle批处理作业 - MapReduce服务 MRS

设置并行度 - MapReduce服务 MRS

使用Loader从HDFS导入数据到ClickHouse - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

使用代理用户提交Spark作业 - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

典型场景：从HDFS导入数据到ClickHouse - MapReduce服务 MRS

使用Hue提交Bundle批处理作业 - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序（Java） - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序（Scala） - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

使用广播变量 - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

典型场景：从关系型数据库导入数据到ClickHouse - MapReduce服务 MRS

分析Hive数据 - MapReduce服务 MRS

MRS集群Manager简介 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

Hive客户端使用实践 - MapReduce服务 MRS

Hudi Compaction操作说明 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线