搜索_华为云

使用Spark小文件合并工具说明 - MapReduce服务 MRS

设置shuffle为false（coalesce），合并后的大小不会非常平均，可能会分布在设置的filesize左右。日志存放位置默认日志存放位置为/tmp/SmallFilesLog.log4j，如需自定义日志存放位置，可在/opt/client/Spark2x/spark/tool/log4j.properties中配置log4j

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
使用旧插件storm-kafka时如何正确设置offset - MapReduce服务 MRS

zkRoot”表示在ZooKeeper中的存放数据的根路径，一般为：“/kafka/{topic}”，“id”表示应用的标示，如：app1。读取offset会有以下两种场景：场景1 当拓扑运行后，KafkaSpout会将offset存放在ZooKeeper路径：“/{zkRoo

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
Flink常用配置参数 - MapReduce服务 MRS

zookeeper.path.root Flink在ZooKeeper上创建的根目录，存放HA模式必须的元数据。 /flink 否 high-availability.storageDir 存放state backend中JobManager元数据，ZooKeeper只保存实际数据的指针。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink运维管理
使用Spark小文件合并工具说明 - MapReduce服务 MRS

设置shuffle为false（coalesce），合并后的大小不会非常平均，可能会分布在设置的filesize左右。日志存放位置默认日志存放位置为/tmp/SmallFilesLog.log4j，如需自定义日志存放位置，可在/opt/client/Spark2x/spark/tool/log4j.properties中配置log4j

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
如何配置HBase文件存储 - MapReduce服务 MRS

HFS的出现，就是为了解决需要在Hadoop中存储海量小文件，同时也要存储一些大文件的混合场景。简单来说，就是在HBase表中，需要存放大量的小文件（10MB以下），同时又需要存放一些比较大的文件（10MB以上）。 HFS为以上场景提供了统一的操作接口，这些操作接口与HBase的函数接口类似。必须在HBase的配置参数“hbase

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发常见问题
HDFS应用开发规则 - MapReduce服务 MRS

cache.behind.writes MapReduce中间文件存放路径 MapReduce默认中间文件夹存放路径只有一个，${hadoop.tmp.dir}/mapred/local，建议修改为每个磁盘下均可存放中间文件。例如：/hadoop/hdfs/data1/mapre

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > HDFS应用开发规范
查看Spark任务日志失败 - MapReduce服务 MRS

现超时。 HDFS存放日志目录权限异常（默认/tmp/logs/用户名/logs）。日志已被清理（spark的JobHistory默认存放7天的eventLog，配置项为spark.history.fs.cleaner.maxAge；MapReduce默认存放15天的任务日志，配置项为mapreduce

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
使用Storm客户端 - MapReduce服务 MRS

件。“人机”用户第一次登录时需修改密码。（普通模式不涉及）操作步骤根据业务情况，准备好客户端，登录安装客户端的节点。请根据客户端所在位置，参考安装客户端章节，登录安装客户端的节点。执行以下命令，切换到客户端安装目录。 cd /opt/hadoopclient 执行以下命令配置环境变量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm
REFRESH TABLE - MapReduce服务 MRS
REFRESH TABLE - MapReduce服务 MRS

在执行此命令之前，应将旧表的表结构定义schema和数据复制到新数据库位置。对于旧版本仓库，源集群和目的集群的时区应该相同。新的数据库和旧数据库的名字应该相同。如果表是聚合表，则应将所有聚合表复制到新的数据库位置。如果旧集群使用HIVE元数据库来存储表结构，则刷新将不起作用，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
写入更新数据时报错UnsupportedOperationException - MapReduce服务 MRS

NG。U具有相同的字段F，该字段的数据类型是INT。Parquet FS不支持这种不兼容的数据类型转换。对于此类错误，请从源头数据采集的位置进行有效的数据类型转换。父主题：数据写入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见问题 > 数据写入
配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

多机架下指定副本位置场景场景说明：在异构集群中，需要分配一些特定的具有高可靠性的节点用以存放重要的商业数据，可以通过标签表达式指定副本位置，指定文件数据块的其中一个副本存放到高可靠性的节点上。 “/data”目录下的数据块，默认三副本情况下，其中至少有一个副本会被存放到RACK1

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Hive开源增强特性 - MapReduce服务 MRS

Colocation接口，可以将存在关联关系或者可能进行关联操作的数据存放在相同的存储节点上。 Hive支持HDFS的Colocation功能，即在创建Hive表时，通过设置表文件分布的locator信息，可以将相关表的数据文件存放在相同的存储节点上，从而使后续的多表关联的数据计算更加方便和高效。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

java:745) 回答用户尝试收集大量数据到Driver端，如果Driver端的内存不足以存放这些数据，那么就会抛出OOM(OutOfMemory)的异常，然后Driver端一直在进行GC，尝试回收垃圾来存放返回的数据，导致应用长时间挂起。解决措施：如果用户需要在OOM场景下强制将应用退出，那么可以在启动Spark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
创建Ranger集群 - MapReduce服务 MRS

开启：使用外置的MySQL数据库存储Ranger组件的User/Group/Policy等数据。关闭：Ranger组件的User/Group/Policy等数据默认存放在当前集群本地数据库中。当“使用外部数据源存储元数据”开启时，选择数据连接类型为“RDS服务MySQL数据库”，数据连接实例选择已创建的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 1.9.2）
添加HBase数据源 - MapReduce服务 MRS

添加HBase数据源本章节指导用户在HSConsole界面添加HBase数据源。添加HBase数据源前提条件数据源所在集群域名与HetuEngine集群域名不能相同。数据源所在集群与HetuEngine集群节点网络互通。在HetuEngine所在集群的所有节点的“/et

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

多机架下指定副本位置场景场景说明：在异构集群中，需要分配一些特定的具有高可靠性的节点用以存放重要的商业数据，可以通过标签表达式指定副本位置，指定文件数据块的其中一个副本存放到高可靠性的节点上。 “/data”目录下的数据块，默认三副本情况下，其中至少有一个副本会被存放到RACK1

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
Alluxio应用开发简介 - MapReduce服务 MRS

Alluxio是一个面向基于云的数据分析和人工智能的开源的数据编排技术。它为数据驱动型应用和存储系统构建了桥梁, 将数据从存储层移动到距离数据驱动型应用更近的位置，从而能够更容易、更快地被访问。同时使得应用程序能够通过一个公共接口连接到许多存储系统。 Alluxio主要特点如下：提供内存级I/O

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Alluxio开发指南 > Alluxio应用开发概述
写入更新数据时报错UnsupportedOperationException - MapReduce服务 MRS

NG。U具有相同的字段F，该字段的数据类型是INT。Parquet FS不支持这种不兼容的数据类型转换。对于此类错误，请从源头数据采集的位置进行有效的数据类型转换。父主题： Hudi常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi常见问题
执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

java:745) 回答用户尝试收集大量数据到Driver端，如果Driver端的内存不足以存放这些数据，那么就会抛出OOM(OutOfMemory)的异常，然后Driver端一直在进行GC，尝试回收垃圾来存放返回的数据，导致应用长时间挂起。解决措施：如果用户需要在OOM场景下强制将应用退出，那么可以在启动Spark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

java:745) 回答用户尝试收集大量数据到Driver端，如果Driver端的内存不足以存放这些数据，那么就会抛出OOM(OutOfMemory)的异常，然后Driver端一直在进行GC，尝试回收垃圾来存放返回的数据，导致应用长时间挂起。解决措施：如果用户需要在OOM场景下强制将应用退出，那么可以在启动Spark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题

总条数： 844

上一页
1
...
4
5
6
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用旧插件storm-kafka时如何正确设置offset - MapReduce服务 MRS

Flink常用配置参数 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

如何配置HBase文件存储 - MapReduce服务 MRS

HDFS应用开发规则 - MapReduce服务 MRS

查看Spark任务日志失败 - MapReduce服务 MRS

使用Storm客户端 - MapReduce服务 MRS

REFRESH TABLE - MapReduce服务 MRS

写入更新数据时报错UnsupportedOperationException - MapReduce服务 MRS

配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

Hive开源增强特性 - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

创建Ranger集群 - MapReduce服务 MRS

添加HBase数据源 - MapReduce服务 MRS

配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

Alluxio应用开发简介 - MapReduce服务 MRS

写入更新数据时报错UnsupportedOperationException - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线