搜索_华为云

Spark client CLI介绍 - MapReduce服务 MRS

CLI详细的使用方法参考官方网站的描述：http://archive.apache.org/dist/spark/docs/3.3.1/quick-start.html。常用CLI Spark常用的CLI如下所示： spark-shell 提供了一个简单学习API的方法，类似于

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
ALM-12006 节点故障（2.x及以前版本） - MapReduce服务 MRS

HostName 产生告警的主机名。对系统的影响节点业务无法提供。可能原因网络断连或硬件故障。处理步骤检查网络是否断连或硬件是否故障。打开MRS集群详情页面，在告警管理页签的告警列表中，单击此告警所在行，在告警详情中，查看该告警的主机地址。登录主管理节点。执行以下命令检查故障节点是否可以访问：

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12028 主机D状态进程数超过阈值（2.x及以前版本） - MapReduce服务 MRS

ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响占用系统资源，业务进程响应变慢。可能原因主机中正在等待的IO（磁盘IO、网

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
beeline客户端报错“OutOfMemoryError” - MapReduce服务 MRS

count(*) from table_name;前确认需要查询的数据量大小，确认是否需要在beeline中显示如此数量级的数据。如数量在一定范围内需要显示，请调整hive客户端的jvm参数，在hive客户端目录/Hive下的component_env中添加export HIVE_O

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
HBase Web UI接口介绍 - MapReduce服务 MRS

Web UI展示了HBase集群的状态，其中包括整个集群概况信息、RegionServer和Master的信息、快照、运行进程等信息。通过Web UI提供的信息可以对整个HBase集群的状况有一定的了解。请联系管理员获取具有访问Web UI权限的业务账号及其密码。操作步骤登录FusionInsight

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > HBase应用开发常见问题 > HBase对外接口介绍
Spark INSERT SELECT语句调优 - MapReduce服务 MRS

SELECT操作可以进行一定的调优操作。查询的数据是大量的小文件。查询的数据是较多的大文件。在Beeline/JDBCServer模式下使用非Spark用户操作。操作步骤可对INSERT...SELECT操作做如下的调优操作。如果建的是Hive表，将存储类型设为Parquet，从而减少执行INSERT

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Hudi表概述 - MapReduce服务 MRS
Hudi表概述 - MapReduce服务 MRS

“.hoodie”文件夹中存放了对应的文件合并操作相关的日志文件。包含_partition_key相关的路径是实际的数据文件和metadata，按分区存储。 Hudi的数据文件使用Parquet文件格式的base file和Avro格式的log file存储。查看Hudi表：登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi
Hudi表概述 - MapReduce服务 MRS
Hudi表概述 - MapReduce服务 MRS

写时复制表也简称cow表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。 Merge

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
ALM-12041关键文件权限异常（2.x及以前版本） - MapReduce服务 MRS

登录MRS集群详情页面，选择“告警管理”。查看该告警的详细信息，查看定位信息中对应的“HostName”字段值，获取该告警产生的主机名，查看定位信息中对应的“PathName”字段值，获取异常的文件路径或者名称。登录告警节点。执行ll pathName命令，其中pathName为前面获取到的异常文件，获取到该

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pi

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式）
Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pi

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式）
CarbonData表空间索引语法说明 - MapReduce服务 MRS

UDF，参数GEO_HASH_INDEX_COLUMN和polygon表的POLYGON_COLUMN。Polygon_column列是一系列的点（经纬度列）。Polygon表的每一行的第一个点和最后一个点必须是相同的。Polygon表的每一行的所有点连接起来形成一个封闭的几何对象。 UDF输入参数：参数类型

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考
Hive SQL运行变慢阶段如何排查 - MapReduce服务 MRS

以下为Hive SQL在哪个阶段执行变慢的排查方法： HiveServer编译变慢查看HiveServer审计日志“/var/log/Bigdata/audit/hive/hiveserver/hive-audit.log”，搜索运行的SQL，如图1的SQL为“show databas

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive故障排除
Spark INSERT SELECT语句调优 - MapReduce服务 MRS

SELECT操作可以进行一定的调优操作。查询的数据是大量的小文件。查询的数据是较多的大文件。在Beeline/JDBCServer模式下使用非Spark用户操作。操作步骤可对INSERT...SELECT操作做如下的调优操作。如果建的是Hive表，将存储类型设为Parquet，从而减少执行INSERT

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

1000)); //配置Streaming的CheckPoint目录。 //由于窗口概念的存在，此参数是必需的。 ssc.checkpoint(checkPointDir); //获取获取kafka使用的topic列表。 String[] topicArr

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming对接kafka0-10程序
MRS集群默认权限信息说明 - MapReduce服务 MRS

Kafka的Topic读写用户组。添加入本组的用户，拥有所有Topic的读写权限。 cdladmin CDL的管理员用户组，只有此组中的用户才可以访问CDL的API。 cdl CDL的普通用户组，属于该组的用户可以执行CDL的创建和查询操作。 storm Storm的普通用户组，

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 集群用户权限概述
删除MRS集群 - MapReduce服务 MRS
删除MRS集群 - MapReduce服务 MRS

RS集群，需要在删除组件或者集群后，手工将OBS上相关的业务数据进行删除。删除MRS按需集群登录MRS管理控制台。在左侧导航栏中选择“现有集群”。在需要删除的集群对应的“操作”列中，单击“删除”。如果确认删除，在弹出的“删除集群”窗口中输入“DELETE ”，单击“确定”。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群
收集ClickHouse系统表转储日志 - MapReduce服务 MRS

temTableDump”。在“主机”中勾选需要获取的主机信息，单击“确定”。单击右上角的时间编辑按钮，设置日志收集的“开始时间”和“结束时间”。收集异常故障日志时间长短可以咨询技术支持人员。单击“下载”，实时转储的系统表会被保存在本地。收集一键转储系统表日志使用ro

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse运维管理
ALM-12027 主机PID使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响无法分配PID给新的业务进程，业务进程不可用。可能原因节点同时运行的进程过多，需要扩展“pid_max”值。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用Spark Shell创建Hudi表 - MapReduce服务 MRS

Hudi/component_env kinit 创建的用户新创建的用户需要修改密码，更改密码后重新kinit登录。普通模式（未开启kerberos认证）无需执行kinit命令。多服务场景下，在source bigdata_env之后，请先source Spark服务的component_env，再去source

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi

总条数： 4529

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark client CLI介绍 - MapReduce服务 MRS

ALM-12006 节点故障（2.x及以前版本） - MapReduce服务 MRS

ALM-12028 主机D状态进程数超过阈值（2.x及以前版本） - MapReduce服务 MRS

beeline客户端报错“OutOfMemoryError” - MapReduce服务 MRS

HBase Web UI接口介绍 - MapReduce服务 MRS

Spark INSERT SELECT语句调优 - MapReduce服务 MRS

Hudi表概述 - MapReduce服务 MRS

Hudi表概述 - MapReduce服务 MRS

ALM-12041关键文件权限异常（2.x及以前版本） - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

CarbonData表空间索引语法说明 - MapReduce服务 MRS

Hive SQL运行变慢阶段如何排查 - MapReduce服务 MRS

Spark INSERT SELECT语句调优 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

MRS集群默认权限信息说明 - MapReduce服务 MRS

删除MRS集群 - MapReduce服务 MRS

收集ClickHouse系统表转储日志 - MapReduce服务 MRS

ALM-12027 主机PID使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

使用Spark Shell创建Hudi表 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线