搜索_华为云

Spark Core性能调优 - MapReduce服务 MRS

Spark Core性能调优 Spark Core数据序列化 Spark Core内存调优 Spark Core内存调优配置Spark Core广播变量配置Spark Executor堆内存参数使用External Shuffle Service提升Spark Core性能

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
Set Digest函数 - MapReduce服务 MRS
Set Digest函数 - MapReduce服务 MRS

通过使用函数ngrams()将输入文本分割为4-shingles（文本被分成长度为4的连续子序列，每个子序列称为一个shingle或者gram），它们被用于创建每个初始文本的集合摘要。将集合摘要相互比较，以获得其相应初始文本相似性的近似值。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

每个分区是一个有序、不可变的消息序列，并不断追加到提交日志文件。分区的消息每个也被赋值一个称为偏移顺序（Offset）的序列化编号。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
提交Hive任务时如何指定队列？ - MapReduce服务 MRS

提交Hive任务时如何指定队列？问题现象怎样在Hive提交任务的时候指定队列？处理步骤在执行语句前通过如下参数设置任务队列，例如，提交任务至队列QueueA。 set mapred.job.queue.name=QueueA; select count(*) from rc

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
IoTDB Java API接口介绍 - MapReduce服务 MRS

void deleteTimeseries(String path) void deleteTimeseries(List<String> paths) 删除一个或多个时间序列。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（安全模式）
使用Kafka Token认证 - MapReduce服务 MRS

props.put(KEY_SERIALIZER, kafkaProc.getValues(KEY_SERIALIZER, "org.apache.kafka.common.serialization.StringSerializer")); // Value序列化类

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式） > 准备Kafka应用开发环境 > 配置Kafka应用安全认证
Flink性能调优建议 - MapReduce服务 MRS

SQL中无需考虑，SQL中数据都为ROW类型，都采用了Flink内置的序列化器，能很高效的进行序列化。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
使用Kafka Token认证 - MapReduce服务 MRS

props.put(KEY_SERIALIZER, kafkaProc.getValues(KEY_SERIALIZER, "org.apache.kafka.common.serialization.StringSerializer")); // Value序列化类

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（安全模式） > 准备Kafka应用开发环境 > 配置Kafka应用安全认证
IoTDB Java API接口介绍 - MapReduce服务 MRS

void deleteTimeseries(String path) void deleteTimeseries(List<String> paths) 删除一个或多个时间序列。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（普通模式）
常用参数 - MapReduce服务 MRS
常用参数 - MapReduce服务 MRS

4d Kryo Kryo是一个非常高效的Java序列化框架，Spark中也默认集成了该框架。几乎所有的Spark性能调优都离不开将Spark默认的序列化器转化为Kryo序列化器的过程。目前Kryo序列化只支持Spark数据层面的序列化，还不支持闭包的序列化。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
查看MRS作业详情和日志 - MapReduce服务 MRS

查看MRS作业详情和日志用户通过管理控制台可在线查看当前MRS集群内所有作业的状态详情，以及作业的详细配置信息和运行日志信息。由于Spark SQL和Distcp作业在后台无日志，因此运行中的Spark SQL和Distcp作业不能在线查看运行日志信息。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业
Spark常用配置参数 - MapReduce服务 MRS

4d Kryo Kryo是一个非常高效的Java序列化框架，Spark中也默认集成了该框架。几乎所有的Spark性能调优都离不开将Spark默认的序列化器转化为Kryo序列化器的过程。目前Kryo序列化只支持Spark数据层面的序列化，还不支持闭包的序列化。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

更好地计算资源利用：将数据压缩，序列化的任务下推到Worker并行计算。高效序列化：优化数据序列化格式，同等数据量级下，更低的数据传输量。流式传输：基于HTTP 2.0 stream, 保证HTTP协议通用性的同时，减少大量数据传输中RPC 重复调用。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
查看MRS集群告警 - MapReduce服务 MRS

序列号系统产生的告警计数。附加信息相关报错信息。 MRS 3.3.0及之后版本：针对监控指标阈值转告警，可以在“附加信息”中查看监控指标值使用情况。定位信息定位告警的详细信息。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看与配置MRS告警事件
当应用程序从lost - MapReduce服务 MRS

当应用程序从lost_and_found队列移动到其他队列时，应用程序不能继续执行问题当删除一个有部分应用程序正在运行的队列，这些应用程序会被移动到“lost_and_found”队列上。当这些应用程序移回运行正常的队列时，某些任务会被挂起，不能正常运行。回答如果应用程序没有设置标签表达式

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn常见问题
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

如果磁盘文件数量特别巨大，对文件读写的性能会带来比较大的影响，此外由于同时打开的文件句柄数量多，序列化以及压缩等操作需要占用非常大的临时内存空间，对内存的使用和GC带来很大的压力，从而容易造成Executor无法响应Driver。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

如果磁盘文件数量特别巨大，对文件读写的性能会带来比较大的影响，此外由于同时打开的文件句柄数量多，序列化以及压缩等操作需要占用非常大的临时内存空间，对内存的使用和GC带来很大的压力，从而容易造成Executor无法响应Driver。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
FlinkServer作业对接Kafka消息队列 - MapReduce服务 MRS

format 必选 String 用于反序列化和序列化Kafka消息的值部分的格式。 properties.* 可选 String 安全模式下需增加认证相关的参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
MRS集群服务常用端口列表 - MapReduce服务 MRS

MRS集群服务常用端口列表本章节介绍MRS集群内各组件的常用端口，在自定义购买MRS集群时，如果集群版本类型为“LTS版”，则用户可以自行选择组件的默认端口是否要保持与开源版本一致。图1 自定义购买LTS版本集群时选择组件端口策略 “组件端口”参数选择“开源”时或者版本类型为“

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维
Spark从HBase读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

SparkHbasetoHbasePythonExample： # -*- coding:utf-8 -*- from py4j.java_gateway import java_import from pyspark.sql import SparkSession # 创建SparkSession，设置kryo序列化

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序

总条数： 2216

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消