搜索_华为云

HDFS调用FileInputFormat的getsplit的时候出现数组越界 - MapReduce服务 MRS

每个block对应的机架信息组成为：/default/rack0/:,/default/rack0/datanodeip:port。该问题是由于某个block块损坏或者丢失，导致该block对应的机器ip和port为空引起的，出现该问题的时候使用hdfs fsck检查对应文件块的健康状态

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS故障排除
如何在Spark命令中指定参数值 - MapReduce服务 MRS

如何在Spark命令中指定参数值问题如果用户不希望在界面上或配置文件设置参数值，如何在Spark命令中指定参数值？回答 Spark的配置项，不仅可以在配置文件中设置，也可以在命令中指定参数值。在Spark客户端，应用执行命令添加如下内容设置参数值，命令执行完成后立即生效。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
MetaStore动态分区数超出阈值导致SQL报错 - MapReduce服务 MRS

Hive中会默认限制最大动态分区数，由“hive.exec.max.dynamic.partitions”参数控制（默认值为1000）。如果超过此限制，Hive将不会创建新的动态分区。处理步骤调整上层业务，将动态分区数控制在“hive.exec.max.dynamic.partitions”参数值范围内。执行set

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
配置MapReduce通过IAM委托访问OBS - MapReduce服务 MRS

登录MRS管理控制台，单击集群名称进入集群详情页面。选择“组件管理 > Mapreduce”，进入Mapreduce服务“全部配置”页面，在左侧的导航列表中选择“Mapreduce > 自定义”。在自定义配置项中，给参数文件“core-site.xml”添加配置项“mapreduce.jobhistory

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS > MRS集群服务对接OBS示例
配置Hive Python3样例工程 - MapReduce服务 MRS

版本为47.3.1。具体软件，请到对应的官方网站获取。 https://pypi.org/project/setuptools/#files 将下载的setuptools压缩文件复制到客户端机器上，解压后进入解压目录，在客户端机器的命令行终端执行python3 setup.py

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

实际上任务却扫描了所有的分区再来计算b=xxx的数据，因此任务计算的很慢。并且因为需要扫描所有文件，会有大量的OBS请求发送。 MRS默认开启基于分区统计信息的执行计划优化，相当于自动执行Analyze Table（默认开启的设置方法为spark.sql.statistics.

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
备NameNode节点长时间未启动，导致启动失败 - MapReduce服务 MRS

e/current”。在HDFS服务页面选择“实例”页签，查看并记录主备NameNode节点的业务IP地址。以root用户登录发生故障的备NameNode节点，将1获取的数据目录中的fsimage文件进行备份。例如备份到“/srv/BigData/namenode/current

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS故障排除
过滤行转换 - MapReduce服务 MRS
过滤行转换 - MapReduce服务 MRS

输入字段名：配置输入字段名，需填写上一个转换步骤生成的字段名。操作：配置操作符。比较值：配置比较值，可直接输入值或输入“#{已存在的字段名}”格式引用字段的具体值。 map 是无数据处理规则条件逻辑为“AND”，如果未添加过滤条件，全部数据成为脏数据；或者原始数据满足添加的全部过滤条件，当前行成为脏数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 转换算子
新建Spark样例工程（可选） - MapReduce服务 MRS

Project”页面，选择“Scala”开发环境，并选择“IDEA”，然后单击“Next”。如果您需要新建Java语言的工程，选择对应参数即可。图2 选择开发环境在工程信息页面，填写工程名称和存放路径，设置JDK版本、Scala SDK版本，然后单击“Finish”完成工程创建。图3 填写工程信息

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
管理MRS集群数据连接 - MapReduce服务 MRS

在数据连接列表的单击待查看的数据连接名称，在弹出的页面查看该数据连接的详细信息。例如查看RDS服务MySQL数据库数据连接信息如下：图1 查看RDS服务MySQL数据库数据连接信息删除数据连接登录MRS管理控制台，在导航栏选择“数据连接”。在数据连接列表的操作列，单击待删除数据连接所在行的“删除

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
Flume客户端安装失败 - MapReduce服务 MRS

Flume客户端安装时会检查环境变量，如果没有可用的JAVA，会报错并退出安装。指定的目录下已经安装有Flume客户端。解决办法如果报JAVA_HOME is null错误，需要使用命令： export JAVA_HOME=java路径设置JAVA_HOME，重新运行安装脚本。如果指定的目录下已经安装有

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flume
查看MRS节点引导操作执行记录 - MapReduce服务 MRS

可以通过选择右上角的“组件首次启动前”或者“组件首次启动后”查询相关的引导操作信息。这里列出的是上次执行结果。对于新创建的集群，则列出的是创建时执行引导操作的记录；如果集群被扩容了，则列出的是上次扩容对新增节点执行引导操作的记录。查看执行日志如果需要查看引导操作的执行日志，请在添加引导操作时将“失败操作”配置为

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群节点 > 配置MRS集群节点引导操作
Join-To-Live - MapReduce服务 MRS
Join-To-Live - MapReduce服务 MRS

Joins中的inner join语句。不支持与作业级TTL、表级TTL、小表广播特性同时使用。使用JTL特性的表需要指定主键，否则可能导致结果不准确。方式一：可通过SQL Hint使用 eliminate-state.left.threshold：表示左边关联次数的阈值，超过阈值后，该条数据就会过期。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
管理MRS集群弹性伸缩策略 - MapReduce服务 MRS

管理MRS集群弹性伸缩策略 MRS集群弹性伸缩策略创建完成后，用户可以在MRS管控台查看、修改、删除、开启和关闭弹性伸缩策略。查看已有弹性伸缩策略登录MRS管理控制台。选择“现有集群”，选中一个运行中的集群并单击集群名称。进入集群详情页面。选择“弹性伸缩”页签。在已有弹性伸缩策略右边单击“查看”按钮。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整 > MRS集群Task节点弹性伸缩
集群状态消息通知 - MapReduce服务 MRS

阅模型，提供一对多的消息订阅以及通知功能，能够实现一站式集成多种推送通知方式。首先，作为主题拥有者，可以先创建一个主题，并对主题设置访问控制权限来决定哪些发布者和订阅者可以通过该主题进行交流。MRS将集群消息发送至您有权限发布消息的主题，然后所有订阅了该主题的订阅者（可以是手机

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
配置Hive Python样例工程 - MapReduce服务 MRS

0，最高不能超过36.8.0。具体软件，请到对应的官方网站获取。 https://pypi.org/project/setuptools/#files 将下载的setuptools压缩文件复制到客户端机器上，解压后进入解压目录，在客户端机器的命令行终端执行python setup.py

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
配置Hive Python样例工程 - MapReduce服务 MRS

0，最高不能超过36.8.0。具体软件，请到对应的官方网站获取。 https://pypi.org/project/setuptools/#files 将下载的setuptools压缩文件复制到客户端机器上，解压后进入解压目录，在客户端机器的命令行终端执行python setup.py

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
使用广播变量 - MapReduce服务 MRS

dcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。每个任务分片在执行中都需要同一份数据集合时，就可以把公共数据集Broadcast到每个节点，让每个节点在本地都保存一份。大表和小表做join

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
HDFS应用开发简介 - MapReduce服务 MRS

同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性是，将那些需进行关联操作的文件存放在相同的数据节点上，在进行关联操作计算时，避免了到别的数据节点上获取数据的动作，大大降低了网络带宽的占用。 Client HDFS Client主要包括五种方式：JAVA

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式）
Flink on Hudi作业参数规则 - MapReduce服务 MRS

ttl），通过-yD添加，默认值为0。根据实际情况而定 Checkpoint间隔时长大于Checkpoint执行时长 checkpoint执行时长视checkpoint的数据量相关，数据量越大实行耗时越大 Checkpoint超时时长大于Checkpoint间隔时长 Checkpoint间隔时长是指多长时间触

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范

总条数： 5873

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HDFS调用FileInputFormat的getsplit的时候出现数组越界 - MapReduce服务 MRS

如何在Spark命令中指定参数值 - MapReduce服务 MRS

MetaStore动态分区数超出阈值导致SQL报错 - MapReduce服务 MRS

配置MapReduce通过IAM委托访问OBS - MapReduce服务 MRS

配置Hive Python3样例工程 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

备NameNode节点长时间未启动，导致启动失败 - MapReduce服务 MRS

过滤行转换 - MapReduce服务 MRS

新建Spark样例工程（可选） - MapReduce服务 MRS

管理MRS集群数据连接 - MapReduce服务 MRS

Flume客户端安装失败 - MapReduce服务 MRS

查看MRS节点引导操作执行记录 - MapReduce服务 MRS

Join-To-Live - MapReduce服务 MRS

管理MRS集群弹性伸缩策略 - MapReduce服务 MRS

集群状态消息通知 - MapReduce服务 MRS

配置Hive Python样例工程 - MapReduce服务 MRS

配置Hive Python样例工程 - MapReduce服务 MRS

使用广播变量 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

Flink on Hudi作业参数规则 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线