搜索_华为云

Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

inner join、aggregate over union all等。为应对不同应用场景的特殊需求，对所有下推模块设计开关功能，用户可以自行配置是否应用上述查询下推的增强。表1 跨源查询增加特性对比模块增强前增强后 aggregate 不支持aggregate下推支持的聚合函数为：sum

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x > Spark2x开源增强特性
通过JDBC方式实现查询HetuEngine SQL任务 - MapReduce服务 MRS

84:2181” 在Manager页面，选择“集群 > 服务 > HetuEngine > 实例”，获取HSBroker所有实例的业务IP；在“配置”页签，搜索“server.port”，获取HSBroker端口号。 user 访问HetuServer的用户名，即在集群中创建的“人机”用户的用户名。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式） > 开发HetuEngine应用 > HetuEngine样例程序（Java）
Flink作业大小表Join能力增强 - MapReduce服务 MRS

/*+ OPTIONS('duplicate.left'='true','duplicate.right'='true')*/ 在SQL语句中配置如同时为左表“user_info”和右表“user_score”设置去重。 CREATE TABLE user_info (`user_id`

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
Spark开源增强特性 - MapReduce服务 MRS

inner join、aggregate over union all等。为应对不同应用场景的特殊需求，对所有下推模块设计开关功能，用户可以自行配置是否应用上述查询下推的增强。表1 跨源查询增加特性对比模块增强前增强后 aggregate 不支持aggregate下推支持的聚合函数为：sum

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Alluxio应用开发简介 - MapReduce服务 MRS

提供内存级I/O 吞吐率，同时降低具有弹性扩张特性的数据驱动型应用的成本开销简化云存储和对象存储接入简化数据管理，提供对多数据源的单点访问应用程序部署简易 Alluxio 接口开发简介 Alluxio支持使用Java进行程序开发，具体的API接口内容请参考https://docs.alluxio

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Alluxio开发指南 > Alluxio应用开发概述
Alluxio - MapReduce服务 MRS
Alluxio - MapReduce服务 MRS

提供内存级I/O吞吐率，同时降低具有弹性扩张特性的数据驱动型应用的成本开销简化云存储和对象存储接入简化数据管理，提供对多数据源的单点访问应用程序部署简易有关Alluxio的详细信息，请参见：https://docs.alluxio.io/os/user/stable/cn/Overview

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
在MRS集群外客户端提交不了Oozie任务或两个小时才提交成功 - MapReduce服务 MRS

/random”的读操作将被阻塞，直到熵池收集到足够的环境噪声数据，导致提交任务慢或者失败。处理步骤在集群外客户端所在节点执行以下命令安装rng-tools工具： yum install rng-tools 执行以下命令启动rng-tools： systemctl start

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Oozie
通过客户端hadoop jar命令提交任务后返回“GC overhead”报错 - MapReduce服务 MRS

试使用combineInputFormat来减少任务读取的文件数量。增大hadoop命令执行时的内存，该内存在客户端中设置，修改“客户端安装目录/HDFS/component_env”文件中“CLIENT_GC_OPTS”的“-Xmx”参数，将该参数的默认值改大，比如改为512m。然后执行source

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Yarn
HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

nfo会执行kill -3将jstack信息打印到.out日志文件里，从而导致.out日志文件过大。处理步骤在每个HDFS实例的节点上部署定期清理.out日志文件的定时任务。后台登录HDFS的实例节点，在crontab -e中添加每天0点清理.out日志的定时任务。 crontab

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
DBService默认端口20050或20051被占用 - MapReduce服务 MRS

释放。解决办法该解决办法以20051端口被占用为例，20050端口被占用的解决办法与该办法类似。以root用户登录DBService安装报错的节点主机，执行命令：netstat -nap | grep 20051查看占用20051端口的进程。使用kill命令强制终止使用20051端口的进程。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用DBservice
由于HDFS块丢失导致DataNode退服失败 - MapReduce服务 MRS

并且HDFS状态为“CORRUPT” 解决办法请确认该损坏的块是否可以删除。是，执行2。否，请联系技术支持。执行以下命令进入HDFS客户端。 cd HDFS客户端安装目录 source bigdata_env kinit 业务用户执行以下命令删除之前记录的损坏的块。 hdfs dfs -rm -skipTrash

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

fo会执行kill -3将jstack信息打印到.out日志文件里，从而导致.out日志文件过大。处理步骤在每个HBase实例的节点上部署定期清理.out日志文件的定时任务。后台登录HBase的实例节点，在crontab -e中添加每天0点清理.out日志的定时任务。 crontab

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
Flink SQL逻辑开发建议 - MapReduce服务 MRS

BUCKET_NUM计算的，BUCKET_NUM默认为1024，可以通过table.optimizer.distinct-agg.split.bucket-num选项进行配置。第二次聚合是由原始group key进行shuffle，并使用SUM聚合来自不同buckets的COUNT DISTINCT值。由于相同的distinct

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范
Hive基本原理 - MapReduce服务 MRS
Hive基本原理 - MapReduce服务 MRS

HiveServer 一个集群内可部署多个HiveServer，负荷分担。对外提供Hive数据库服务，将用户提交的HQL语句进行编译，解析成对应的Yarn任务或者HDFS操作，从而完成数据的提取、转换、分析。 MetaStore 一个集群内可部署多个MetaStore，负荷分担。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
查看Ranger审计信息 - MapReduce服务 MRS

可根据关键字字段进行筛选。表1 Audit信息页签内容描述 Access 当前MRS不支持在线查看组件资源的审计日志信息，可登录组件安装节点，进入“/var/log/Bigdata/audit”目录下查看各组件的审计日志。 Admin Ranger上操作审计信息，例如安全访

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x）
Sqoop客户端使用实践 - MapReduce服务 MRS

前提条件 MRS 3.1.0及之后版本在创建集群时已勾选Sqoop组件。安装客户端，具体请参考安装客户端（3.x及之后版本）。例如安装目录为“/opt/client”，以下操作的客户端目录只是举例，请根据实际安装目录修改。客户端目录/Sqoop/sqoop/lib下已有对应驱动包

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
ALM-19011 RegionServer的Region数量超出阈值 - MapReduce服务 MRS

否，执行3。图1 HBase的WebUI 负载均衡以root用户登录HBase客户端所在节点，用户密码为安装前用户自定义，请咨询系统管理员。进入客户端安装目录，设置环境变量： cd 客户端安装目录 source bigdata_env 如果集群采用安全版本，要进行安全认证。执行kinit

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark从HBase读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

JavaSparkContext jsc = new JavaSparkContext(conf); // 建立连接hbase的配置参数，此时需要保证hbase-site.xml在classpath中 Configuration hbConf = HBaseConfiguration

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序
Manager关键特性 - MapReduce服务 MRS

个不同的租户统称多租户。多租户功能支持层级式的租户模型，支持动态的添加和删除租户，实现资源的隔离，可以对租户的计算资源和存储资源进行动态配置和管理。计算资源指租户Yarn任务队列资源，可以修改任务队列的配额，并查看任务队列的使用状态和使用统计。存储资源目前支持HDFS存储，

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Manager
Spark从HBase读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

文件名等请与实际代码保持一致，此处仅为示例）：运行Java或Scala样例代码 bin/spark-submit --jars {客户端安装路径}/Spark/spark/jars/protobuf-java-2.5.0.jar --conf spark.yarn.user.classpath

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序

总条数： 4809

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

通过JDBC方式实现查询HetuEngine SQL任务 - MapReduce服务 MRS

Flink作业大小表Join能力增强 - MapReduce服务 MRS

Spark开源增强特性 - MapReduce服务 MRS

Alluxio应用开发简介 - MapReduce服务 MRS

Alluxio - MapReduce服务 MRS

在MRS集群外客户端提交不了Oozie任务或两个小时才提交成功 - MapReduce服务 MRS

通过客户端hadoop jar命令提交任务后返回“GC overhead”报错 - MapReduce服务 MRS

HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

DBService默认端口20050或20051被占用 - MapReduce服务 MRS

由于HDFS块丢失导致DataNode退服失败 - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

Flink SQL逻辑开发建议 - MapReduce服务 MRS

Hive基本原理 - MapReduce服务 MRS

查看Ranger审计信息 - MapReduce服务 MRS

Sqoop客户端使用实践 - MapReduce服务 MRS

ALM-19011 RegionServer的Region数量超出阈值 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

Manager关键特性 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线