搜索_华为云

导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程操作场景 Spark针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Spark工程。针对Java和Scala不同语言的工程，其导入方式相同。使用Python开发的样例工程不需要导入，直接打开Python文件（*

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程操作场景 Spark针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Spark工程。针对Java和Scala不同语言的工程，其导入方式相同。使用Python开发的样例工程不需要导入，直接打开Python文件（*

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
费用账单 - MapReduce服务 MRS
费用账单 - MapReduce服务 MRS

费用账单您可以在管理控制台选择页面上方的“费用 > 费用账单”，进入费用中心，在“账单管理”查看资源的费用账单，以了解该资源在某个时间段的使用量和计费信息。账单上报周期包年/包月计费模式的资源完成支付后，会实时上报一条账单到计费系统进行结算。按需计费模式的资源按照固定周期

 帮助中心 > MapReduce服务 MRS > 计费说明
新建Spark应用开发工程（可选） - MapReduce服务 MRS

新建Spark应用开发工程（可选）操作场景除了导入Spark样例工程，您还可以使用IDEA新建一个Spark工程。如下步骤以创建一个Scala工程为例进行说明。操作步骤打开IDEA工具，选择“Create New Project”。图1 创建工程在“New Proje

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 准备Spark应用开发环境
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
组件WebUI便捷访问 - MapReduce服务 MRS

组件WebUI便捷访问大数据组件都有自己的WebUI页面管理自身系统，但是由于网络隔离的原因，用户并不能很简便地访问到该页面。例如访问HDFS的WebUI页面，传统的操作方法是需要用户创建ECS，使用ECS远程登录组件的UI，这使得组件的页面UI访问很是繁琐，对于很多初次接触大数据的用户很不友好。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
配置SparkSQL的分块个数 - MapReduce服务 MRS

配置SparkSQL的分块个数配置场景 SparkSQL在进行shuffle操作时默认的分块数为200。在数据量特别大的场景下，使用默认的分块数就会造成单个数据块过大。如果一个任务产生的单个shuffle数据块大于2G，该数据块在被fetch的时候还会报类似错误： Adjusted

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
使用Hue提交Oozie Java作业 - MapReduce服务 MRS

使用Hue提交Oozie Java作业操作场景该任务指导用户通过Hue界面提交Java类型的Oozie作业。操作步骤创建工作流，请参考使用Hue创建工作流。在工作流编辑页面，选择“Java 程序”按钮，将其拖到操作区中。在弹出的“Java program”窗口中配置“Jar

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Hue提交Oozie作业
Spark增量读取Hudi参数规范 - MapReduce服务 MRS

Spark增量读取Hudi参数规范规则增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例 set hoodie.tableName.consume.mode=INCREMENT

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
HDFS常见问题 - MapReduce服务 MRS
HDFS常见问题 - MapReduce服务 MRS

HDFS常见问题执行distcp命令报错如何处理 HDFS执行Balance时被异常停止如何处理访问HDFS WebUI时，界面提示无法显示此页 HDFS WebUI无法正常刷新损坏数据的信息 NameNode节点长时间满负载导致客户端无响应为什么主NameNode重启后系统出现双备现象

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
配置HDFS token的最大存活时间 - MapReduce服务 MRS

配置HDFS token的最大存活时间配置场景安全模式下，HDFS中用户可以对Token的最大存活时间和Token renew的时间间隔进行灵活地设置，根据集群的具体需求合理地配置。配置描述参数入口：请参考修改集群服务配置参数，进入HDFS的“全部配置”页面，在搜索框中输入参数名称。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
配置HDFS token的最大存活时间 - MapReduce服务 MRS

配置HDFS token的最大存活时间配置场景安全模式下，HDFS中用户可以对Token的最大存活时间和Token renew的时间间隔进行灵活地设置，根据集群的具体需求合理地配置。配置描述参数入口：请参考修改集群服务配置参数，进入HDFS的“全部配置”页面，在搜索框中输入参数名称。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffl

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffl

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
配置Hive Python3样例工程 - MapReduce服务 MRS

配置Hive Python3样例工程操作场景为了运行MRS产品Hive组件的Python3接口样例代码，需要完成下面的操作。该样例仅支持在Linux节点上运行。操作步骤客户端机器必须安装有Python3，其版本不低于3.6，最高不能超过3.8。在客户端机器的命令行终端

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
配置Hive Python3样例工程 - MapReduce服务 MRS

配置Hive Python3样例工程操作场景为了运行MRS产品Hive组件的Python3接口样例代码，需要完成下面的操作。该样例仅支持在Linux节点上运行。操作步骤客户端机器必须安装有Python3，其版本不低于3.6，最高不能超过3.8。在客户端机器的命令行终端

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
使用MySQL客户端连接Doris数据库时报错“plugin not enabled”如何处理 - MapReduce服务 MRS

使用MySQL客户端连接Doris数据库时报错“plugin not enabled”如何处理问题现象使用MySQL客户端连接Doris数据库时报错： ERROR 2059 (HY000): Authentication plugin 'mysql_clear_password'

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见问题

总条数： 5463

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

费用账单 - MapReduce服务 MRS

新建Spark应用开发工程（可选） - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

组件WebUI便捷访问 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

使用Hue提交Oozie Java作业 - MapReduce服务 MRS

Spark增量读取Hudi参数规范 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

HDFS常见问题 - MapReduce服务 MRS

配置HDFS token的最大存活时间 - MapReduce服务 MRS

配置HDFS token的最大存活时间 - MapReduce服务 MRS

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

配置Hive Python3样例工程 - MapReduce服务 MRS

配置Hive Python3样例工程 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

使用MySQL客户端连接Doris数据库时报错“plugin not enabled”如何处理 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线