搜索_华为云

准备Storm应用开发和运行环境 - MapReduce服务 MRS

JDK默认只支持TLS V1.0，若使用IBM JDK，请配置启动参数“com.ibm.jsse2.overrideDefaultTLS”为“true”，设置后可以同时支持TLS V1.0/V1.1/V1.2，详情参见https://www.ibm.com/support/knowledgecenter/zh/SSYKE2_8

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > 准备Storm应用开发环境
Spark Python API接口介绍 - MapReduce服务 MRS

应用提供Spark的各种功能，如连接Spark集群、创建RDD、广播变量等。 pyspark.SparkConf：Spark应用配置类。如设置应用名称，执行模式，executor内存等。 pyspark.RDD（Resilient Distributed Dataset）：用于在

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
BulkPut接口使用 - MapReduce服务 MRS

hbase.enabled”设置为“true”（该参数值默认为“false”，改为“true”后对已有业务没有影响。如果要卸载HBase服务，卸载前请将此参数值改回“false”），将配置项“spark.inputFormat.cache.enabled”设置为“false”。提交命令

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
Spark Python API接口介绍 - MapReduce服务 MRS

应用提供Spark的各种功能，如连接Spark集群、创建RDD、广播变量等。 pyspark.SparkConf：Spark应用配置类。如设置应用名称，执行模式，executor内存等。 pyspark.RDD（Resilient Distributed Dataset）：用于在

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
BulkLoad接口使用 - MapReduce服务 MRS

hbase.enabled”设置为“true”（该参数值默认为“false”，改为“true”后对已有业务没有影响。如果要卸载HBase服务，卸载前请将此参数值改回“false”），将配置项“spark.inputFormat.cache.enabled”设置为“false”。提交命令

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
MapReduce访问多组件样例代码 - MapReduce服务 MRS

getInstance(conf); job.setJarByClass(MultiComponentExample.class); // 设置mapper&reducer类 job.setMapperClass(MultiComponentMapper.class);

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式） > 开发MapReduce应用 > MapReduce访问多组件样例程序
CDL数据集成概述 - MapReduce服务 MRS

PostgreSQL数据库需要有修改“statement_timeout”和“lock_timeout”两个超时参数的设置权限以及查询删除Slot和publication权限。 “max_wal_senders”建议设置为Slot的1.5倍或2倍。在PostgreSQL表的复制标识是default的情况下，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL
BulkLoad接口使用 - MapReduce服务 MRS

hbase.enabled”设置为“true”（该参数值默认为“false”，改为“true”后对已有业务没有影响。如果要卸载HBase服务，卸载前请将此参数值改回“false”），将配置项“spark.inputFormat.cache.enabled”设置为“false”。提交命令

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
foreachPartition接口使用 - MapReduce服务 MRS

hbase.enabled”设置为“true”（该参数值默认为“false”，改为“true”后对已有业务没有影响。如果要卸载HBase服务，卸载前请将此参数值改回“false”），将配置项“spark.inputFormat.cache.enabled”设置为“false”。提交命令

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
Spark Python API接口介绍 - MapReduce服务 MRS

应用提供Spark的各种功能，如连接Spark集群、创建RDD、广播变量等。 pyspark.SparkConf：Spark应用配置类。如设置应用名称，执行模式，executor内存等。 pyspark.RDD（Resilient Distributed Dataset）：用于在

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
操作HBase数据源 - MapReduce服务 MRS

hbase.enabled”设置为“true”（该参数值默认为“false”，改为“true”后对已有业务没有影响。如果要卸载HBase服务，卸载前请将此参数值改回“false”），将配置项“spark.inputFormat.cache.enabled”设置为“false”。提交命令

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
同步Kafka数据至ClickHouse - MapReduce服务 MRS

说明：启用Kerberos认证下，使用21005端口需要“allow.everyone.if.no.acl.found”参数值设置为true；如果不设置此参数，操作会报错。 Kafka集群broker实例IP获取方法如下：登录FusionInsight Manager，然后选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入
安装MRS 3.x及之后版本Flume客户端 - MapReduce服务 MRS

Flume “-d”：Flume客户端安装路径。 “-f”（可选）：两个MonitorServer角色的业务IP或主机名，中间用逗号分隔，若不设置则Flume客户端将不向MonitorServer发送告警信息，同时在FusionInsight Manager界面上看不到该客户端的相关信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 安装Flume客户端
使用MRS Spark SQL访问DWS表 - MapReduce服务 MRS

SQL语言，用于对结构化数据进行操作。使用Spark SQL，可以访问不同的数据库，用户可以从这些数据库中提取数据，处理并加载到不同的数据存储中。本实践演示如何使用MRS Spark SQL访问GaussDB(DWS)数据。方案架构 Spark的应用运行架构如图1所示，运行流程如下所示：应用程

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
Spark Python接口介绍 - MapReduce服务 MRS

应用提供Spark的各种功能，如连接Spark集群、创建RDD、广播变量等。 pyspark.SparkConf：Spark应用配置类。如设置应用名称，执行模式，executor内存等。 pyspark.RDD（Resilient Distributed Dataset）：用于在

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark Java API接口介绍 - MapReduce服务 MRS

rk的各种功能，如连接Spark集群，创建RDD，累积量和广播量等。它的作用相当于一个容器。 SparkConf：Spark应用配置类，如设置应用名称，执行模式，executor内存等。 JavaRDD：用于在java应用中定义JavaRDD的类，功能类似于scala中的RDD(Resilient

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
BulkPut接口使用 - MapReduce服务 MRS

hbase.enabled”设置为“true”（该参数值默认为“false”，改为“true”后对已有业务没有影响。如果要卸载HBase服务，卸载前请将此参数值改回“false”），将配置项“spark.inputFormat.cache.enabled”设置为“false”。提交命令

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
Spark Python API接口介绍 - MapReduce服务 MRS

应用提供Spark的各种功能，如连接Spark集群、创建RDD、广播变量等。 pyspark.SparkConf：Spark应用配置类。如设置应用名称，执行模式，executor内存等。 pyspark.RDD（Resilient Distributed Dataset）：用于在

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Storm-HBase开发指引 - MapReduce服务 MRS

票据方式：从管理员处获取一个“人机”用户，用于后续的安全登录，开启Kerberos服务的renewable和forwardable开关并且设置票据刷新周期，开启成功后重启kerberos及相关组件。获取的用户需要属于storm组。默认情况下，用户的密码有效期是90天，所以获取

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
同步Kafka数据至ClickHouse - MapReduce服务 MRS

说明：启用Kerberos认证下，使用21005端口需要“allow.everyone.if.no.acl.found”参数值设置为true；若不设置此参数，操作会报错。 Kafka集群broker实例IP获取方法如下： MRS 3.x及后续版本，登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse数据导入

总条数： 3292

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备Storm应用开发和运行环境 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

BulkPut接口使用 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

MapReduce访问多组件样例代码 - MapReduce服务 MRS

CDL数据集成概述 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

同步Kafka数据至ClickHouse - MapReduce服务 MRS

安装MRS 3.x及之后版本Flume客户端 - MapReduce服务 MRS

使用MRS Spark SQL访问DWS表 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

BulkPut接口使用 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Storm-HBase开发指引 - MapReduce服务 MRS

同步Kafka数据至ClickHouse - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线