搜索_华为云

准备本地应用开发环境 - MapReduce服务 MRS

JDK，请确保IntelliJ IDEA中的JDK配置为Open JDK。不同的IntelliJ IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。安装Scala Scala开发环境的基本配置。版本要求：2.12

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

数据量少的Task在运行完成后，导致很多CPU空闲，造成CPU资源浪费。通过如下配置项可开启自动进行数据倾斜处理功能，通过将Hash分桶后数据量很大的、且超过数据倾斜阈值的分桶拆散，变成多个task处理一个桶的数据机制，提高CPU资源利用率，提高系统性能。未产生倾斜的数据，将采用原有方式进行分桶并运行。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
配置Yarn通过Guardian访问OBS - MapReduce服务 MRS

AUTHORIZATION”区域的组件插件名称“OBS”。单击“Add New Policy”，为1新建的用户组添加相应OBS路径的“Read”和“Write”权限。例如，为用户组“obs_hadoop1”添加“obs://OBS并行文件系统名称/hadoop1”的“Read”和“Write”权限：

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过Guardian对接OBS > MRS集群服务对接OBS示例
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
准备本地应用开发环境 - MapReduce服务 MRS

若使用Open JDK，请确保IntelliJ IDEA中的JDK配置为Open JDK。不同的IntelliJ IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。 7-zip 用于解压“*.zip”和“*

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（普通模式） > 准备Kudu应用开发环境
SET/RESET - MapReduce服务 MRS
SET/RESET - MapReduce服务 MRS

me”的值。 Display参数值： SET parameter_name 此命令用于显示指定的“parameter_name”的值。 Display会话参数： SET 此命令显示所有支持的会话参数。 Display会话参数以及使用细节： SET -v 此命令显示所有支持的会话参数及其使用细节。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
准备Hive应用开发和运行环境 - MapReduce服务 MRS

在应用开发过程中，如需在本地Windows系统中调测应用程序，需要复制解压目录下的“hosts”文件中的内容到客户端所在节点的hosts文件中，确保本地机器能与解压目录下“hosts”文件中所列出的各主机在网络上互通。当客户端所在主机不是集群中的节点时，配置客户端网络连接，可避免执行客户端命令时出现错误。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 准备Hive应用开发环境
准备Spark本地应用开发环境 - MapReduce服务 MRS

JDK，请确保IntelliJ IDEA中的JDK配置为Open JDK。不同的IntelliJ IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。安装Scala Scala开发环境的基本配置。版本要求：2.12

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
准备本地应用开发环境 - MapReduce服务 MRS

若使用Open JDK，请确保IntelliJ IDEA中的JDK配置为Open JDK。不同的IntelliJ IDEA不要使用相同的workspace和相同路径下的示例工程。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。 7-zip 用于解压“*

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式） > 准备HetuEngine应用开发环境
创建Loader角色 - MapReduce服务 MRS

Connection的编辑、删除和引用权限）在“配置资源权限”的表格中选择“待操作集群的名称 > Loader > 作业连接器”。在指定作业连接的“权限”列，勾选“编辑”。设置Loader作业分组的编辑权限（包括修改作业分组的名称、删除指定分组、在指定分组下创建作业的权限、从外部

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
创建Loader角色 - MapReduce服务 MRS

Connection的编辑、删除和引用权限）在“配置资源权限”的表格中选择“待操作集群的名称 > Loader > 作业连接器”。在指定作业连接的“权限”列，勾选“编辑”。设置Loader作业分组的编辑权限（包括修改作业分组的名称、删除指定分组、在指定分组下创建作业的权限、从外部

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader用户权限管理
配置Yarn大作业扫描 - MapReduce服务 MRS

pool 获取NodeManager的监控的大作业的信息的线程数。 50 max.job.count 事件中显示大作业的数量。 10 job.monitor.local.dir.threshold 监控NodeManager本地磁盘作业目录的大小，超过当前阈值就会上报事件。单位：GB。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn运维管理
Loader基本原理 - MapReduce服务 MRS

元数据仓库，存储和管理Loader的连接器、转换步骤、作业等数据。 HA Manager 管理Loader Server进程的主备状态，Loader Server包含2个节点，以主备方式部署。 Loader通过MapReduce作业实现并行的导入或者导出作业任务，不同类型的导入导出作业可能只包含Map阶段或者同时Map和Reduce阶段。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Loader
创建Hive表 - MapReduce服务 MRS
创建Hive表 - MapReduce服务 MRS

一个表可以拥有一个或者多个分区，每个分区以文件夹的形式单独存在表文件夹的目录下。对分区内数据进行查询，可缩小查询范围，加快数据的检索速度和可对数据按照一定的条件进行管理。分区是在创建表的时候用PARTITIONED BY子句定义的。 CREATE EXTERNAL TABLE

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 开发Hive应用 > Hive JDBC访问样例程序
Kafka日志介绍 - MapReduce服务 MRS
Kafka日志介绍 - MapReduce服务 MRS

DEBUG表示记录系统及系统的调试信息。如果您需要修改日志级别，请执行如下操作：请参考修改集群服务配置参数，进入Kafka的“全部配置”页面。左边菜单栏中选择所需修改的角色所对应的日志菜单。选择所需修改的日志级别。保存配置，在弹出窗口中单击“确定”使配置生效。日志格式 Kafka的日志格式如下所示：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka运维管理
创建Hive表 - MapReduce服务 MRS
创建Hive表 - MapReduce服务 MRS

一个表可以拥有一个或者多个分区，每个分区以文件夹的形式单独存在表文件夹的目录下。对分区内数据进行查询，可缩小查询范围，加快数据的检索速度和可对数据按照一定的条件进行管理。分区是在创建表的时候用PARTITIONED BY子句定义的。 CREATE EXTERNAL TABLE

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
配置HetuEngine SQL防御规则 - MapReduce服务 MRS

建HetuEngine的用户并授予相关权限，且需要通过Ranger为该用户配置操作数据源的数据库、表、列的管理权限。配置HetuEngine SQL防御使用约束防御规则默认动态生效时间为5分钟。拦截和熔断规则会中断SQL查询，请根据实际业务配置合理的值。熔断规则由系统Se

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群SQL防御规则
Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

<batchTime>为Streaming分批的处理间隔。 // <windowTime>为统计数据的时间跨度,时间单位都是秒。 // <topics>为Kafka中订阅的主题，多以逗号分隔。 // <brokers>为获取元数据的kafka地址。 val Array(batchTime

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming程序
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优

总条数： 745

上一页
1
...
27
28
29
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备本地应用开发环境 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

配置Yarn通过Guardian访问OBS - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

SET/RESET - MapReduce服务 MRS

准备Hive应用开发和运行环境 - MapReduce服务 MRS

准备Spark本地应用开发环境 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

创建Loader角色 - MapReduce服务 MRS

创建Loader角色 - MapReduce服务 MRS

配置Yarn大作业扫描 - MapReduce服务 MRS

Loader基本原理 - MapReduce服务 MRS

创建Hive表 - MapReduce服务 MRS

Kafka日志介绍 - MapReduce服务 MRS

创建Hive表 - MapReduce服务 MRS

配置HetuEngine SQL防御规则 - MapReduce服务 MRS

Scala样例代码 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线