搜索_华为云

经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

coalesce(numPartitions: Int, shuffle: Boolean = false) 当shuffle为true的时候，函数作用与repartition(numPartitions: Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
Yarn节点配置调优 - MapReduce服务 MRS

目前推荐将该值设置为逻辑CPU核数的1.5～2倍之间。若任务为计算密集型，该参数可设置为与逻辑CPU核数一致。若任务为非计算密集型资源，该参数可设置为逻辑CPU核数的1.5～2倍之间。若任务所使用的CPU核数与内存资源差异较大时，CPU资源可参考实际的内存资源进行配置。例如大部分任务使用1核3G，如果“yarn

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
CDL作业数据DDL变更说明 - MapReduce服务 MRS

alter table tableName add columns(columnName columnType); 在源端数据库中新增与Hudi新增的同样列名与数据类型。在CDL WebUI界面启动1停止的任务。修改字段类型字段类型转换时，需要确保源值的数据类型能够正确转换为目标类

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL
配置Ranger元数据存储至RDS - MapReduce服务 MRS

登录RDS管理控制台，购买RDS实例，具体操作请参考购买实例。为了保证集群和MySQL或PostgreSQL数据库的网络访问，建议该实例与MRS集群的虚拟私有云和子网一致。 RDS实例的安全组入方向规则需要放通MySQL（默认为“3306”）和PostgreSQL（默认为“5432”）数据库端口。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
准备连接Kafka集群配置文件 - MapReduce服务 MRS

在应用开发过程中，如需在本地Windows系统中调测应用程序，需要确保本地节点能与“hosts”文件中所列出的各主机在网络上互通。如果当前节点与MRS集群所在网络平面不互通，可以通过绑定EIP的方式访问MRS集群，具体操作请参考配置Windows通过EIP访问集群Kafka。 Win

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式） > 准备Kafka应用开发环境
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须与NettySource的并发度相同，否则无法正常创建连接。开发思路 1. 一个Job作为发布者Job，其余两个作为订阅者Job 2. 发布

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Job Pipeline样例程序
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

echo "${files[*]}") 进入Spark客户端目录，调用bin/spark-submit脚本运行代码，运行命令分别如下（类名与文件名等请与实际代码保持一致，此处仅为示例）： Spark Streaming读取Kafka 0-10 Write To Print代码样例

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

coalesce(numPartitions: Int, shuffle: Boolean = false) 当shuffle为true的时候，函数作用与repartition(numPartitions: Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

coalesce(numPartitions: Int, shuffle: Boolean = false) 当shuffle为true的时候，函数作用与repartition(numPartitions: Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
在Kafka Topic中接入消息 - MapReduce服务 MRS

/config/consumer.properties 确保当前consumer在线消费。确保配置文件consumer.properties中的group.id与命令中--group的参数均配置为待查询的group。 Kafka集群IP端口号安全模式下是21007，普通模式下是9092。使用KafkaUI查看当前消费情况

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka
ALM-16047 HiveServer已从Zookeeper注销 - MapReduce服务 MRS

Manager界面，单击“审计”，在审计页面单击“高级搜索”，单击“操作类型”右侧的，选择“保存配置 > 确定”，再单击“搜索”。查看搜索结果中“服务”列为与Hive、ZooKeeper相关的服务，检查近期修改的配置，表1为部分可能影响Hive连接ZooKeeper的配置。表1 Hive连接ZooKeeper的相关配置

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45435 ClickHouse表元数据不一致 - MapReduce服务 MRS

--host 上报告警的ClickHouseServer实例IP --user 用户名 --password --port 9000 查询是否有与告警表相关的正在执行的任务：查询是否有执行中的sql任务： select * from system.processes where current_database='库名'

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-24005 Flume传输数据异常（2.x及以前版本） - MapReduce服务 MRS

单击进入故障节点的Flume实例页面，查看指标“Sink速度指标”，检查其速度是否为0。是，执行2.a。否，处理完毕。检查Flume Sink配置的IP所在节点与故障节点的网络状态。确认Flume Sink是否是avro类型。是，执行2.c。否，执行3。登录故障节点所在主机，执行以下命令切换root用户。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
准备Hive应用开发和运行环境 - MapReduce服务 MRS

安装集群客户端的Linux节点并获取相关配置文件。在节点中安装客户端，例如客户端安装目录为“/opt/client”。客户端机器的时间与集群的时间要保持一致，时间差小于5分钟。集群的Master节点或者Core节点使用客户端可参考集群内节点使用MRS客户端，MRS集群外客户

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境
准备Spark本地应用开发环境 - MapReduce服务 MRS

如果使用Linux环境调测程序，需在Linux节点安装集群客户端并获取相关配置文件。在节点中安装客户端，例如客户端安装目录为“/opt/client”。客户端机器的时间与集群的时间要保持一致，时间差小于5分钟。集群的Master节点或者Core节点使用客户端可参考集群内节点使用MRS客户端，MRS集群外客户

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
典型场景：从关系型数据库导入数据到HBase - MapReduce服务 MRS

、mysql-fastpath-connector），输入配置连接参数，单击“测试”验证连接是否可用，待提示“测试成功”后单击“确定”。与关系数据库连接时，可以选择通用数据库连接器（generic-jdbc-connector）或者专用数据库连接器（oracle-connect

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
使用Loader从关系型数据库导入数据到HBase - MapReduce服务 MRS

、mysql-fastpath-connector），输入配置连接参数，单击“测试”验证连接是否可用，待提示“测试成功”后单击“确定”。与关系数据库连接时，可以选择通用数据库连接器（generic-jdbc-connector）或者专用数据库连接器（oracle-connect

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
查询集群节点列表 - MapReduce服务 MRS

查询集群节点列表功能介绍查询集群节点列表。调用方法请参见如何调用API。 URI GET /v2/{project_id}/clusters/{cluster_id}/nodes 表1 路径参数参数是否必选参数类型描述 project_id 是 String 参数解释：

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
配置HivePython3样例工程 - MapReduce服务 MRS

dependencies for future==0.18.2 对于“dependency_python3.x”文件夹下同时存在aarch64与x86_64版本的“egg”文件，需要根据操作系统选取其中一个版本安装即可，使用uname -p命令确认当前操作系统架构。 MRS 3.2.

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

报class not found异常。进入Spark客户端目录，调用bin/spark-submit脚本运行代码，运行命令分别如下（类名与文件名等请与实际代码保持一致，此处仅为示例）：运行Java或Scala样例代码： bin/spark-submit --master yarn

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming样例程序

总条数： 3800

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

经验总结 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

CDL作业数据DDL变更说明 - MapReduce服务 MRS

配置Ranger元数据存储至RDS - MapReduce服务 MRS

准备连接Kafka集群配置文件 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

在Kafka Topic中接入消息 - MapReduce服务 MRS

ALM-16047 HiveServer已从Zookeeper注销 - MapReduce服务 MRS

ALM-45435 ClickHouse表元数据不一致 - MapReduce服务 MRS

ALM-24005 Flume传输数据异常（2.x及以前版本） - MapReduce服务 MRS

准备Hive应用开发和运行环境 - MapReduce服务 MRS

准备Spark本地应用开发环境 - MapReduce服务 MRS

典型场景：从关系型数据库导入数据到HBase - MapReduce服务 MRS

使用Loader从关系型数据库导入数据到HBase - MapReduce服务 MRS

查询集群节点列表 - MapReduce服务 MRS

配置HivePython3样例工程 - MapReduce服务 MRS

Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线