搜索_华为云

Spark应用开发简介 - MapReduce服务 MRS

式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：支持迭代计算，有效应对多步的数据处理逻辑。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
Spark应用开发简介 - MapReduce服务 MRS

式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：支持迭代计算，有效应对多步的数据处理逻辑。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
Hudi数据表设计规范 - MapReduce服务 MRS

Hudi数据表设计规范 Hudi表模型设计规范 Hudi表索引设计规范 Hudi表分区设计规范父主题： Hudi应用开发规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范
快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

步骤三：准备应用程序及数据：准备MRS集群客户端内wordcount样例程序运行所需的数据文件。步骤四：提交作业并查看结果：在集群客户端提交wordcount数据分析作业并查看执行结果。准备工作注册账号并实名认证。在创建MRS集群之前，请先注册华为账号并开通华为云，进行实名认证。

帮助中心 > MapReduce服务 MRS > 快速入门
配置Flink作业状态后端冷热数据分离存储 - MapReduce服务 MRS

cold 指定冷数据状态后端存储，当前仅支持“hbase”。 hbase table.exec.state.ttl 数据状态变化的超时时间。 table.exec.state.cold.enabled为true时：表示热数据的超期时间，超过该值热数据将成为冷数据。 table.exec

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
向Kafka生产并消费数据程序 - MapReduce服务 MRS

向Kafka生产并消费数据程序 Flink向Kafka生产并消费数据应用开发思路 Flink向Kafka生产并消费数据Java样例代码 Flink向Kafka生产并消费数据Scala样例代码父主题：开发Flink应用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 开发Flink应用
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

低；另一方面，数据量少的Task在运行完成后，导致很多CPU空闲，造成CPU资源浪费。通过如下配置项可开启自动进行数据倾斜处理功能，通过将Hash分桶后数据量很大的、且超过数据倾斜阈值的分桶拆散，变成多个task处理一个桶的数据机制，提高CPU资源利用率，提高系统性能。未产生

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
使用Loader从HDFS/OBS导入数据到HBase - MapReduce服务 MRS

HBASE_BULKLOAD 数据量大 HBase实例在HBase作业中，Loader支持从集群可添加的所有HBase服务实例中选择任意一个。如果选定的HBase服务实例在集群中未添加，则此作业无法正常运行。 HBase 导入前清理数据导入前清空原表的数据。“True”为执行清空，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
增强HBase BulkLoad工具数据迁移能力 - MapReduce服务 MRS

增强HBase BulkLoad工具数据迁移能力使用BulkLoad工具批量导入HBase数据使用BulkLoad工具批量更新HBase数据使用BulkLoad工具批量删除HBase数据使用BulkLoad工具查询HBase表的行统计数 BulkLoad工具配置文件说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强
ClickHouse数据库设计规范 - MapReduce服务 MRS

ClickHouse数据库设计规范 ClickHouse设计规范概述 ClickHouse集群规划 ClickHouse数据库设计 ClickHouse数据库开发 ClickHouse数据库调优 ClickHouse数据库运维

 帮助中心 > MapReduce服务 MRS > 最佳实践
使用Hive - MapReduce服务 MRS
使用Hive - MapReduce服务 MRS

使用Hive Hive用户权限管理 Hive客户端使用实践快速使用Hive进行数据分析 Hive数据存储及加密配置 Hive on HBase 配置Hive读取关系型数据库数据 Hive企业级能力增强 Hive性能调优 Hive运维管理 Hive常见SQL语法说明 Hive常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
MapReduce服务 MRS - MapReduce服务 MRS

的多个任务对同一个数据集进行计算时的IO瓶颈。Spark利用Scala语言实现，Scala能够使得处理分布式数据集时，能够像处理本地化数据一样。除了交互式的数据分析，Spark还能够支持交互式的数据挖掘，由于Spark是基于内存的计算，很方便处理迭代计算，而数据挖掘的问题通常都是

 帮助中心 > MapReduce服务 MRS > 功能总览
恢复Manager数据（MRS 2.x及之前版本） - MapReduce服务 MRS

该任务指导用户通过MRS Manager创建恢复元数据任务。只支持创建任务手动恢复数据。只支持进行数据备份时的系统版本与当前系统版本一致时的数据恢复。当业务正常时需要恢复数据，建议手动备份最新管理数据后，再执行恢复数据操作。否则会丢失从备份时刻到恢复时刻之间的元数据。必须使用同一时间点的OMS

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 恢复MRS集群组件数据
添加MySQL数据源 - MapReduce服务 MRS

添加MySQL数据源本章节适用于MRS 3.3.0及之后的版本。 HetuEngine支持配置MySQL数据源实现对MySQL数据源的接入与查询功能。本章节指导用户在集群的HSConsole界面添加MySQL类型的JDBC数据源。添加MySQL数据源前提条件数据源与HetuEngine集群节点网络互通。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
关闭HetuEngine数据类型隐式转换 - MapReduce服务 MRS

HetuEngine > 概览”，单击“HSConsole WebUI”的HSConsole链接进入计算实例界面。选择并停止需要配置的计算实例，单击计算实例的“配置”，进入计算实例配置界面。根据使用场景删除如下自定义配置并保存。名称值参数文件说明 implicit-conversion

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine数据类型隐式转换
ClickHouse数据入库规范 - MapReduce服务 MRS

part过多，merge压力变大，甚至出现异常影响数据插入；数据的一致性问题：数据先在分布式表写入节点的主机落盘，然后数据被异步地发送到本地表所在主机进行存储，中间没有一致性的校验，如果分布式表写入数据的主机出现异常，会存在数据丢失风险；对于数据写分布式表和数据写本地表相比，分布式表数据写入性能也会变慢，单

 帮助中心 > MapReduce服务 MRS > 最佳实践 > ClickHouse数据库设计规范 > ClickHouse数据库开发 > ClickHouse数据入库
配置MRS集群通过IAM委托对接OBS - MapReduce服务 MRS

配置MRS集群通过IAM委托对接OBS MRS支持用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算模式。MRS通过IAM服务的“委托”机制进行简单配置，实现使用ECS自动获取的临时AK/SK访问OBS。避免了AK/SK直接暴露在配置文件中的风险。通过绑定委托

 帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS
ALM-12039 OMS数据库主备不同步 - MapReduce服务 MRS

产生告警的主机名。对系统的影响 OMS数据库主备不同步会导致主数据库上的数据无法正常同步至备数据库，在告警上报时间段若主实例异常可能会导致用户业务数据丢失或者Manager页面数据显示异常。可能原因主备节点网络不稳定。备OMS数据库异常。备节点磁盘空间满。处理步骤检查主备节点网络是否正常。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MRS多租户简介 - MapReduce服务 MRS

不同的租户之间数据隔离，以保证数据安全。多租户资源概述 MRS集群的资源分为计算资源和存储资源。多租户可实现资源的隔离。计算资源计算资源包括CPU和内存。租户之间不可以相互占用计算资源，私有计算资源独立。计算资源可分为静态服务资源和动态资源：大数据集群为Yarn分配

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户
Spark与其他组件的关系 - MapReduce服务 MRS

Spark与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端(Driver)

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark

总条数： 4144

上一页
1
...
8
9
10
...
208
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Hudi数据表设计规范 - MapReduce服务 MRS

快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

配置Flink作业状态后端冷热数据分离存储 - MapReduce服务 MRS

向Kafka生产并消费数据程序 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

使用Loader从HDFS/OBS导入数据到HBase - MapReduce服务 MRS

增强HBase BulkLoad工具数据迁移能力 - MapReduce服务 MRS

ClickHouse数据库设计规范 - MapReduce服务 MRS

使用Hive - MapReduce服务 MRS

MapReduce服务 MRS - MapReduce服务 MRS

恢复Manager数据（MRS 2.x及之前版本） - MapReduce服务 MRS

添加MySQL数据源 - MapReduce服务 MRS

关闭HetuEngine数据类型隐式转换 - MapReduce服务 MRS

ClickHouse数据入库规范 - MapReduce服务 MRS

配置MRS集群通过IAM委托对接OBS - MapReduce服务 MRS

ALM-12039 OMS数据库主备不同步 - MapReduce服务 MRS

MRS多租户简介 - MapReduce服务 MRS

Spark与其他组件的关系 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线