搜索_华为云

使用CDM服务迁移HBase数据至MRS集群 - MapReduce服务 MRS

务时，可能会影响其他业务，建议在业务空闲期进行数据迁移任务。全量数据迁移登录CDM管理控制台。创建CDM集群，该CDM集群的安全组、虚拟私有云、子网需要和迁移目的端集群保持一致，保证CDM集群和待迁移的MRS集群之间网络互通。在“集群管理”页面单击待操作集群对应“操作”列的“作业管理”。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

topics.split(",").toSet // 通过brokers和topics直接创建kafka stream // 1.接收Kafka中数据，生成相应DStream val kafkaParams = Map[String, String]("metadata

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming程序
Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

KafkaWordCountProducer {BrokerList} {Topic} {messagesPerSec} {wordsPerMessage} 开发思路接收Kafka中数据，生成相应DataStreamReader。对单词记录进行分类统计。计算结果，并进行打印。打包项目通过IDEA自带

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Loader基本原理 - MapReduce服务 MRS

在MapReduce作业的Reduce阶段中，按Region的个数启动同样个数的Reduce Task，Reduce Task从Map接收数据，然后按Region生成HFile，存放在HDFS临时目录中。在MapReduce作业的提交阶段，将HFile从临时目录迁移到HBase目录中。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Loader
Spark应用开发建议 - MapReduce服务 MRS

烦。 Spark Streaming性能优化建议设置合理的批处理时间(batchDuration)。设置合理的数据接收并行度。设置多个Receiver接收数据。设置合理的Receiver阻塞时间。设置合理的数据处理并行度。使用Kryo系列化。内存调优。设置持久化级别减少GC开销。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
Executor进程Crash导致Stage重试 - MapReduce服务 MRS

pc 0x00007fcda9eb8eb1 回答上述问题在Oracle官网上有类似的情况，该问题现象是Oracle JVM的缺陷，并不是平台代码引入的问题，且Spark中有对Executor的容错机制，Executor Crash之后，Stage会进入重试，可以保证任务最终可以执行完成，不会对业务产生影响。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
使用Python提交Flink SQL作业 - MapReduce服务 MRS

k-sql”中的“pyflink-sql.py”和“datagen2kafka.sql”。参考准备本地应用开发环境将准备好的Python虚拟环境打包，获取“venv.zip”文件。 zip -q -r venv.zip venv/ 以root用户登录主管理节点，将1和2获取的“venv

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > PyFlink样例程序
使用Python提交Flink SQL作业 - MapReduce服务 MRS

k-sql”中的“pyflink-sql.py”和“datagen2kafka.sql”。参考准备本地应用开发环境将准备好的Python虚拟环境打包，获取“venv.zip”文件。 zip -q -r venv.zip venv/ 以root用户登录主管理节点，将1和2获取的“venv

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > PyFlink样例程序
配置Spark Native引擎 - MapReduce服务 MRS

LD_PRELOAD参数提前加载。 x86平台上参数值设置为：{客户端安装目录}/Spark/spark/native/libch.so,{客户端安装目录}/JDK/jdk1.8.0_372/jre/lib/amd64/libjsig.so arm平台上参数值设置为：{客户端安装目录}/

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

s.asList(topicArr)); // 通过brokers和topics直接创建kafka stream // 接收Kafka中数据，生成相应DStream JavaDStream<String> lines = KafkaUtils.createDirectStream(jssc

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Streaming从Kafka读取数据再写入HBase
Flink SQL语法增强 - MapReduce服务 MRS

INTERVAL '5' SECOND)) GROUP BY `name`, window_start, window_end 该特性还支持窗口接收到迟到数据时输出当前窗口的开始时间和结束时间，可通过添加在Hint中'window.start.field'和'window.end.fi

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
Flink作业大小表Join能力增强 - MapReduce服务 MRS

不支持LEFT JOIN时小表为左表，RIGHT JOIN时小表为右表。 Flink作业大小表Join去重在双流关联的业务模型中，关联算子接收到其中一个流发送的大量重复数据，则会导致下游算子需要处理大量重复数据，影响作业性能。如A表字段（P1，A1，A2）使用如下方式关联B表字

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
Executor进程Crash导致Stage重试 - MapReduce服务 MRS

pc 0x00007fcda9eb8eb1 回答上述问题在Oracle官网上有类似的情况，该问题现象是Oracle JVM的缺陷，并不是平台代码引入的问题，且Spark中有对Executor的容错机制，Executor Crash之后，Stage会进入重试，可以保证任务最终可以执行完成，不会对业务产生影响。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

KafkaWordCountProducer {BrokerList} {Topic} {messagesPerSec} {wordsPerMessage} 开发思路接收Kafka中数据，生成相应DataStreamReader。对单词记录进行分类统计。计算结果，并进行打印。打包项目通过IDEA自带

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming样例程序
准备本地应用开发环境 - MapReduce服务 MRS

0之前版本，登录FusionInsight Manager，选择“集群 > 概览 > 更多 > 下载客户端”，“选择客户端类型”设置为“完整客户端”，注意平台类型与待安装客户端节点的节点类型相同（x86为x86_64，ARM为aarch64），单击“确定”，等待客户端文件包生成后根据浏览器提示下载客户端到本地并解压。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式） > 准备HetuEngine应用开发环境
MRS最佳实践汇总 - MapReduce服务 MRS

表2 开发者社区精选最佳实践分类相关文档热门组件介绍 MRS StarRocks，新一代极速全场景数据仓库 Hudi：新一代流式数据湖平台高性能利器-MRS ClickHouse重磅推出基于MRS-ClickHouse构建用户画像系统方案介绍基于MRS-Hudi构建数据湖的典型应用场景介绍

 帮助中心 > MapReduce服务 MRS > 最佳实践
Spark应用开发常见问题 - MapReduce服务 MRS

Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败从checkpoint恢复spark应用的限制第三方jar包跨平台（x86、TaiShan）支持在客户端安装节点的/tmp目录下残留了很多blockmgr-开头和spark-开头的目录 ARM环境python

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
HMaster日志中频繁打印出FileNotFoundException信息 - MapReduce服务 MRS

表1 splitlog参数说明参数描述默认值 hbase.splitlog.manager.timeout 分布式日志分裂管理程序接收worker回应的超时时间 600000 父主题： HBase故障排除

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase故障排除
Hive Join数据优化 - MapReduce服务 MRS

optimize.skewjoin=true”并调整“hive.skewjoin.key”的大小。“hive.skewjoin.key”是指Reduce端接收到多少个key即认为数据是倾斜的，并自动分发到多个Reduce。父主题： Hive性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Hive Join数据优化 - MapReduce服务 MRS

optimize.skewjoin=true”并调整hive.skewjoin.key的大小。hive.skewjoin.key是指Reduce端接收到多少个key即认为数据是倾斜的，并自动分发到多个Reduce。父主题： Hive性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优

总条数： 535

上一页
1
...
18
19
20
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用CDM服务迁移HBase数据至MRS集群 - MapReduce服务 MRS

Scala样例代码 - MapReduce服务 MRS

Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

Loader基本原理 - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

Executor进程Crash导致Stage重试 - MapReduce服务 MRS

使用Python提交Flink SQL作业 - MapReduce服务 MRS

使用Python提交Flink SQL作业 - MapReduce服务 MRS

配置Spark Native引擎 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

Flink SQL语法增强 - MapReduce服务 MRS

Flink作业大小表Join能力增强 - MapReduce服务 MRS

Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

MRS最佳实践汇总 - MapReduce服务 MRS

Spark应用开发常见问题 - MapReduce服务 MRS

HMaster日志中频繁打印出FileNotFoundException信息 - MapReduce服务 MRS

Hive Join数据优化 - MapReduce服务 MRS

Hive Join数据优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线