搜索_华为云

安全集群中使用Python3.x对接Kafka - MapReduce服务 MRS

Python3.x的tgz包也可以去Python官网下载。推荐使用Python-3.6.X版本，3.7版本无法使用rdd的take函数。执行如下命令，设置Python3.x的配置信息及编译安装，安装到/opt/Bigdata/python3目录下。 ./configure --prefix=

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

得task大小合理化。修改并行度。优化数据结构把数据按列存放，读取数据时就可以只扫描需要的列。使用Hash Shuffle时，通过设置spark.shuffle.consolidateFiles为true，来合并shuffle中间文件，减少shuffle文件的数量，减少文

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

得task大小合理化。修改并行度。优化数据结构把数据按列存放，读取数据时就可以只扫描需要的列。使用Hash Shuffle时，通过设置spark.shuffle.consolidateFiles为true，来合并shuffle中间文件，减少shuffle文件的数量，减少文

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
ImportTsv工具执行失败报“Permission denied”异常 - MapReduce服务 MRS

用户，例如admin用户）不具备该目录的rwx权限。上述问题可通过执行以下步骤解决：在客户端将“hbase.fs.tmp.dir”参数设置为当前kerberos用户的目录（如“/user/admin/hbase-staging”），或者为客户端（kerberos用户）提供已配置的目录所必须的rwx权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase故障排除
Sqoop常用命令及参数介绍 - MapReduce服务 MRS

--lines-terminated-by 设定行分隔符，和Hive表或HDFS文件保持一致 --mysql-delimiters MySQL默认分隔符设置 export参数 --input-fields-terminated-by 字段分隔符 --input-lines-terminated-by

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Sqoop
从零开始使用Kudu - MapReduce服务 MRS

从零开始使用Kudu Kudu是专为Apache Hadoop平台开发的列式存储管理器。Kudu具有Hadoop生态系统应用程序的共同技术特性：可水平扩展，并支持高可用性操作。前提条件已安装集群客户端，例如安装目录为“/opt/hadoopclient”，以下操作的客户端目录只是举例，请根据实际安装目录修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kudu
从零开始使用Kudu - MapReduce服务 MRS

从零开始使用Kudu Kudu是专为Apache Hadoop平台开发的列式存储管理器。Kudu具有Hadoop生态系统应用程序的共同技术特性：可水平扩展，并支持高可用性操作。前提条件已安装集群客户端，例如安装目录为“/opt/hadoopclient”，以下操作的客户端目录只是举例，请根据实际安装目录修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kudu
Sqoop常用命令及参数介绍 - MapReduce服务 MRS

--lines-terminated-by 设定行分隔符，和hive表或hdfs文件保持一致 --mysql-delimiters MySQL默认分隔符设置 export参数 --input-fields-terminated-by 字段分隔符 --input-lines-terminated-by

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

得task大小合理化。修改并行度。优化数据结构把数据按列存放，读取数据时就可以只扫描需要的列。使用Hash Shuffle时，通过设置spark.shuffle.consolidateFiles为true，来合并shuffle中间文件，减少shuffle文件的数量，减少文

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
编包并运行Spark应用 - MapReduce服务 MRS

编包并运行Spark应用操作场景在程序代码完成开发后，您可以将打包好的jar包上传至Linux客户端环境中运行应用。使用Scala或Java语言开发的应用程序在Spark客户端的运行步骤是一样的。 Spark应用程序只支持在Linux环境下运行，不支持在Windows环境下运行。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 调测Spark应用
使用Kafka生产消费数据 - MapReduce服务 MRS

使用Kafka生产消费数据操作场景用户可以通过MRS集群客户端完成Kafka Topic的创建、查询、删除等操作，也可以通过登录KafkaUI查看当前集群的消费信息。前提条件使用Kafka客户端时：已安装客户端，例如安装目录为“/opt/client”，以下操作的客户端目录只是举例，请根据实际安装目录修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka
从零开始使用CarbonData - MapReduce服务 MRS

如果集群启用了Kerberos认证，则需要在工作环境准备CSV文件，然后可以使用开源HDFS命令，参考5将文件从工作环境导入HDFS，并设置Spark组件用户在HDFS中对文件有读取和执行的权限。例如，HDFS的“tmp”目录有一个文件“data.csv”，内容如下： x123

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x之前版本）
更新弹性伸缩策略 - MapReduce服务 MRS

个Task节点。如果 YARNAppRunning 小于等于25 ，并持续 1 个五分钟，则终止 1个Task节点。冷却时间皆为20分钟，并且设置了该策略下弹出的节点会打上aaa=bbb的标签。 /v2/{project_id}/autoscaling-policy/{cluster_id}

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 弹性伸缩接口
CarbonData - MapReduce服务 MRS
CarbonData - MapReduce服务 MRS

该格式具有许多新型列存储文件的特性。例如，分割表，压缩模式等。CarbonData具有以下独有的特点：伴随索引的数据存储：由于在查询中设置了过滤器，可以显著加快查询性能，减少I/O扫描次数和CPU资源占用。CarbonData索引由多个级别的索引组成，处理框架可以利用这个索引

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Flink HA方案介绍 - MapReduce服务 MRS

ate和none。只有配置fixed-delay、failure-rate，Job才可以恢复。另外，如果配置了重启策略为none，但Job设置了Checkpoint，默认会将重启策略改为fixed-delay，且重试次数是配置项“restart-strategy.fixed-delay

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

使用Hive CBO功能优化查询效率操作场景在Hive中执行多表Join时，Hive支持开启CBO（Cost Based Optimization），系统会自动根据表的统计信息，例如数据量、文件数等，选出合适计划提高多表Join的效率。Hive需要先收集表的统计信息后才能使CBO正确的优化。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
查看HetuEngine实例监控页面 - MapReduce服务 MRS

查看HetuEngine实例监控页面在HetuEngine的WebUI界面，可以查看指定业务的详细信息，包括每个SQL的执行情况。查看HetuEngine实例监控步骤使用可访问HetuEngine WebUI界面的管理员用户登录FusionInsight Manager，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 管理HetuEngine计算实例
添加GBase数据源 - MapReduce服务 MRS

添加GBase数据源本章节适用于MRS 3.5.0及之后的版本。 HetuEngine支持配置GBase数据源实现对GBase数据源的接入与查询功能。本章节指导用户在集群的HSConsole界面添加GBase类型的JDBC数据源。前提条件数据源与HetuEngine集群节点网络互通。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Spark执行应用时上报“Connection to ip:port has been quiet for xxx ms while there are outstanding requests”并导致应用结束 - MapReduce服务 MRS

driver失联，然后整个应用停止。解决办法：在Spark客户端的“spark-defaults.conf”文件中或通过set命令行进行设置。参数配置时要保证channel过期时间（spark.rpc.io.connectionTimeout）大于或等于RPC响应超时时间（spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
Spark从HBase读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

Integer.parseInt(hbase1Value) + Integer.parseInt(hbase2Value); // 设置结果到put对象 put.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes(qualifier)

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序

总条数： 2881

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

安全集群中使用Python3.x对接Kafka - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

ImportTsv工具执行失败报“Permission denied”异常 - MapReduce服务 MRS

Sqoop常用命令及参数介绍 - MapReduce服务 MRS

从零开始使用Kudu - MapReduce服务 MRS

从零开始使用Kudu - MapReduce服务 MRS

Sqoop常用命令及参数介绍 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

编包并运行Spark应用 - MapReduce服务 MRS

使用Kafka生产消费数据 - MapReduce服务 MRS

从零开始使用CarbonData - MapReduce服务 MRS

更新弹性伸缩策略 - MapReduce服务 MRS

CarbonData - MapReduce服务 MRS

Flink HA方案介绍 - MapReduce服务 MRS

使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

查看HetuEngine实例监控页面 - MapReduce服务 MRS

添加GBase数据源 - MapReduce服务 MRS

Spark执行应用时上报“Connection to ip:port has been quiet for xxx ms while there are outstanding requests”并导致应用结束 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线