搜索_华为云

提升HBase实时读数据效率 - MapReduce服务 MRS

理线程数。建议根据CPU的使用情况，可以选择设置为100至300之间的值。 200 hfile.block.cache.size HBase缓存区大小，主要影响查询性能。根据查询模式以及查询记录分布情况来决定缓存区的大小。如果采用随机查询使得缓存区的命中率较低，可以适当降低缓存区大小。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
Flume运维管理 - MapReduce服务 MRS
Flume运维管理 - MapReduce服务 MRS

Flume运维管理 Flume常用配置参数 Flume日志介绍查看Flume客户端日志查看Flume客户端监控信息停止或卸载Flume客户端父主题：使用Flume

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
Hive JDBC样例程序开发思路 - MapReduce服务 MRS

数据分析代码实现，请见查询Hive表数据。查看薪水支付币种为美元的雇员联系方式。查询入职时间为2014年的雇员编号、姓名等字段，并将查询结果加载进表employees_info_extended中的入职时间为2014的分区中。统计表employees_info中有多少条记录。查询使用以“cn”结尾的邮箱的员工信息。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 开发Hive应用 > Hive JDBC访问样例程序
为什么创建Hive表失败？ - MapReduce服务 MRS

回答当源表或子查询具有大数据量的Partition时，创建Hive表失败。执行查询需要很多的task，此时输出的文件数就会很多，从而导致driver OOM。可以在创建Hive表的语句中增加distribute by子句来解决这个问题，其中distribute by的字段要选取合

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData常见问题
Flink HA方案介绍 - MapReduce服务 MRS

nager的元数据从HDFS恢复。但恢复期间，旧的业务不能运行，新的业务不能提交。ZooKeeper上还是存有JobManager的元数据，比如运行Job的信息，会提供给新的JobManager使用。对于TaskManager的失败，由JobManager上Akka的DeathW

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

uselocalFileCollect开启的情况下生效。直接序列化的方式，还是间接序列化的方式保存结果数据到磁盘。优点：针对分区数特别多的表查询结果汇聚性能优于直接使用结果数据保证在磁盘的方式。缺点：和spark.sql.uselocalFileCollect开启时候的缺点一样。 true：使用该功能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
Datasource Avro格式查询异常 - MapReduce服务 MRS

Datasource Avro格式查询异常问题 Datasource Avro格式查询报错，提示Caused by: org.apache.spark.sql.avro.IncompatibleSchemaException。回答针对avro格式表查询报错，根本原因是avro格式

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark故障排除
在Linux环境中调测ClickHouse应用（MRS 3.3.0及之后版本） - MapReduce服务 MRS

clickhouse-examples-*.jar 查看调测结果 ClickHouse应用程序运行完成后，可通过以下方式查看程序运行情况：通过运行结果查看程序运行情况。通过ClickHouse日志获取应用运行情况。即查看当前jar文件所在目录的“logs/clickhouse-example

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（普通模式） > 调测ClickHouse应用
配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

uselocalFileCollect开启的情况下生效。直接序列化的方式，还是间接序列化的方式保存结果数据到磁盘。优点：针对分区数特别多的表查询结果汇聚性能优于直接使用结果数据保证在磁盘的方式。缺点：和spark.sql.uselocalFileCollect开启时候的缺点一样。 true：使用该功能

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
HetuEngine应用开发流程介绍 - MapReduce服务 MRS

准备开发和运行环境 HetuEngine的应用程序支持使用任何语言调用JDBC接口进行开发，当前样例主要是java语言。推荐使用IDEA工具，请根据指导完成不同语言的开发环境配置。HetuEngine的运行环境即客户端，请根据指导完成客户端的安装和配置。准备本地应用开发环境准备工程

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式）
NameNode节点存在ALM-12027主机PID使用率超过阈值告警 - MapReduce服务 MRS

$2}' |sort -n |uniq -c |sort -n 执行后结果如下：查看启动线程数最多的进程，案例中进程2346为NameNode进程，启动了5.4万线程，且持续增长。多次打印对应进程的jstack日志，根据jstack日志信息发现，NameNode存在大量线程处于WAITING，且长期不释放。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
补丁基本信息说明 - MapReduce服务 MRS

统计时间不正确。 SQL中查询表格大于10张时，查询结果排序与实际的排序不符。 JobGateway提交的SparkSql/SparkScript同名列作业展示的结果不正确。 JobBalance连接数监控为空。管控面提交Spark作业Jar包所在的桶与业务桶使用同一个时，长时间运行后访问obs

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.3.0-LTS.1.1补丁说明
ClickHouse企业级能力增强 - MapReduce服务 MRS

ClickHouse企业级能力增强 ClickHouse多租户管理查看ClickHouse慢查询语句查看ClickHouse复制表数据同步监控配置ClickHouse副本间数据强一致配置ClickHouse支持事务能力配置通过ELB访问ClickHouse 配置ClickHouse冷热分离

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse
API版本选择建议 - MapReduce服务 MRS

当前MRS服务对外API提供云服务自定义规范的API V1.1和V2两类接口，V2版本目前仅部分接口支持，主要用于提交作业和提交SQL语句。在接口功能相同的情况下，推荐您优先使用V2接口。 MRS所有版本均支持V1.1接口。针对MRS 1.X版本的集群，MRS 1.8.7及之后版本支持V2接口。

帮助中心 > MapReduce服务 MRS > API参考
UNION | INTERSECT | EXCEPT - MapReduce服务 MRS

来将多个SELECT语句的结果集合并成单个结果集。 UNION UNION将第一个查询的结果集中的所有行与第二个查询的结果集中的行合并。 query UNION [ALL | DISTINCT] query ALL和DISTINCT表示是否返回包含重复的行。ALL返回所有的行；D

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
Spark Python API接口介绍 - MapReduce服务 MRS

当有两个KV的dataset(K,V)和(K,W)，返回的是(K,(V,W))的dataset,numPartitions为并发的任务数。 cogroup(other, numPartitions) 将当有两个key-value对的dataset(K,V)和(K,W)，返回的是(K,

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

当有两个KV的dataset(K,V)和(K,W)，返回的是(K,(V,W))的dataset,numPartitions为并发的任务数。 cogroup(other, numPartitions) 将当有两个key-value对的dataset(K,V)和(K,W)，返回的是(K,

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
HetuEngine应用开发简介 - MapReduce服务 MRS

态无缝融合，实现海量数据秒级交互式查询；支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine基本概念 HSBroker：HetuEngine的服务代理，用作用户租户管理校验，HetuEngine访问URL的获取等。 Coordinator：H

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式）
HBase shell客户端在使用中有INFO信息打印在控制台导致显示混乱 - MapReduce服务 MRS

影响HBase shell窗口的显示。 HBase客户端命令繁多，例如：hbase shell、hbase hbck、hbase org.apache.hadoop.hbase.mapreduce.RowCounter等，且后续还会增加。部分命令的输出为INFO打印，如果直接把I

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
Flink Java API接口介绍 - MapReduce服务 MRS

maxRetry) 获取用户定义的Socket数据，作为输入流数据。 hostname是指Socket的服务器端的主机名称。 port指的是服务器的监测端口。 delimiter指的是消息之间的分隔符。 maxRetry指的是由于连接异常可以触发的最大重试次数。 public D

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > Flink应用开发常见问题 > Flink常用API介绍

总条数： 5085

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

提升HBase实时读数据效率 - MapReduce服务 MRS

Flume运维管理 - MapReduce服务 MRS

Hive JDBC样例程序开发思路 - MapReduce服务 MRS

为什么创建Hive表失败？ - MapReduce服务 MRS

Flink HA方案介绍 - MapReduce服务 MRS

配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

Datasource Avro格式查询异常 - MapReduce服务 MRS

在Linux环境中调测ClickHouse应用（MRS 3.3.0及之后版本） - MapReduce服务 MRS

配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

HetuEngine应用开发流程介绍 - MapReduce服务 MRS

NameNode节点存在ALM-12027主机PID使用率超过阈值告警 - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

ClickHouse企业级能力增强 - MapReduce服务 MRS

API版本选择建议 - MapReduce服务 MRS

UNION | INTERSECT | EXCEPT - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

HetuEngine应用开发简介 - MapReduce服务 MRS

HBase shell客户端在使用中有INFO信息打印在控制台导致显示混乱 - MapReduce服务 MRS

Flink Java API接口介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线