搜索_华为云

启用MRS集群间拷贝功能 - MapReduce服务 MRS

当用户需要将保存在HDFS中的数据从当前集群备份到另外一个集群时，需要使用DistCp工具。DistCp工具依赖于集群间拷贝功能，该功能默认未启用，复制数据的集群双方都需要配置。管理员可以根据以下指导，在Manager修改参数以启用集群间拷贝功能，启用之后即可创建将数据备份至远端HDFS（RemoteHDFS）的备份任务。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据
使用Spark执行Hudi样例程序（Scala） - MapReduce服务 MRS

下面代码片段仅为演示，具体代码参见：com.huawei.bigdata.hudi.examples.HoodieDataSourceExample。插入数据： def insertData(spark: SparkSession, tablePath: String, tableName: String

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
install编译构建HBase Jar包失败报错Could not transfer artifact如何处理 - MapReduce服务 MRS

install编译构建HBase Jar包失败报错Could not transfer artifact如何处理问题样例代码在进行maven编译构建jar包时，Build Failed，提示错误信息：Could not transfer artifact org.apache

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > HBase应用开发常见问题
使用二次开发程序产生Unable to read HiveServer2异常如何处理 - MapReduce服务 MRS

使用二次开发程序产生Unable to read HiveServer2异常如何处理问题使用二次开发程序产生异常，提示“Unable to read HiveServer2 configs from ZooKeeper”信息。回答问题原因使用的krb5.conf、user

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > Hive应用开发常见问题
Spark INSERT SELECT语句调优 - MapReduce服务 MRS

INSERT SELECT语句调优操作场景在以下几种情况下，执行INSERT...SELECT操作可以进行一定的调优操作。查询的数据是大量的小文件。查询的数据是较多的大文件。在Beeline/JDBCServer模式下使用非Spark用户操作。操作步骤可对INSERT...SELECT操作做如下的调优操作。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
使用Spark执行Hudi样例程序（Scala） - MapReduce服务 MRS

下面代码片段仅为演示，具体代码参见：com.huawei.bigdata.hudi.examples.HoodieDataSourceExample。插入数据： def insertData(spark: SparkSession, tablePath: String, tableName: String

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
使用Spark执行Hudi样例程序（Scala） - MapReduce服务 MRS

下面代码片段仅为演示，具体代码参见：com.huawei.bigdata.hudi.examples.HoodieDataSourceExample。插入数据： def insertData(spark: SparkSession, tablePath: String, tableName: String

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
创建CarbonData表 - MapReduce服务 MRS

可从表中加载数据和查询数据。使用自定义列创建表可通过指定各列及其数据类型来创建表。启用Kerberos认证的分析集群创建CarbonData表时，如果用户需要在默认数据库“default”以外的数据库创建新表，则需要在Hive角色管理中为用户绑定的角色添加指定数据库的“Create”权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x之前版本）
HBase应用开发规则 - MapReduce服务 MRS

写入失败的数据要做相应的处理在写数据的过程中，如果进程异常或一些其它的短暂的异常，可能会导致一些写入操作失败。因此，对于操作的数据，需要将其记录下来。在集群恢复正常后，重新将其写入到HBase数据表中。另外，有一点需要注意：HBase Client返回写入失败的数据，是不会自

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > HBase应用开发规范
HBase输入 - MapReduce服务 MRS
HBase输入 - MapReduce服务 MRS

map 是无数据处理规则当配置HBase表名不存在时，作业提交失败。当配置的列名与HBase表列名不匹配时，读取不到数据，导入数据条数会为0。配置输入字段列数，大于原始数据实际包含字段列数，全部数据成为脏数据。当字段的值与实际的类型不匹配时，该行数据会成为脏数据。样例以

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
从零开始使用Spark SQL - MapReduce服务 MRS

Spark提供类似SQL的Spark SQL语言操作结构化数据，本章节提供从零开始使用Spark SQL，创建一个名称为src_data的表，然后在src_data表中每行写入一条数据，最后将数据存储在“mrs_20160907”集群中。再使用SQL语句查询src_data表中的数据，最后可将src_data表删除。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark（MRS 3.x之前版本）
Hudi表概述 - MapReduce服务 MRS
Hudi表概述 - MapReduce服务 MRS

写时复制表也简称cow表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。 Merge

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi
创建HBase权限角色 - MapReduce服务 MRS

e表和列族的读（R）、写（W）、创建（C）、执行（X）或管理（A）权限。用户需要在HBase中对指定的数据库或表设置权限，才能够创建表、查询数据、删除数据、插入数据、更新数据以及授权他人访问HBase表。本章节适用于MRS 3.x及之后版本。仅开启了Kerberos认证的集群（安全模式）支持创建HBase角色。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase
ClickHouse应用程序开发思路 - MapReduce服务 MRS

建立连接：建立和ClickHouse服务实例的连接。创建库：创建ClickHouse数据库。创建表：创建ClickHouse数据库下的表。插入数据：插入数据到ClickHouse表中。查询数据：查询ClickHouse表数据。删除表：删除已创建的ClickHouse表。父主题：开发ClickHouse应用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（安全模式） > 开发ClickHouse应用
配置SparkSQL的分块个数 - MapReduce服务 MRS

配置SparkSQL的分块个数配置场景 SparkSQL在进行shuffle操作时默认的分块数为200。在数据量特别大的场景下，使用默认的分块数就会造成单个数据块过大。如果一个任务产生的单个shuffle数据块大于2G，该数据块在被fetch的时候还会报类似错误： Adjusted frame length

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
提交Spark任务到新增Task节点 - MapReduce服务 MRS

集群Task节点主要用于处理数据，不存放持久数据。本章节指导用户通过租户资源绑定新增的Task节点，并提交Spark任务到新增的Task节点。方案架构租户是MRS大数据平台的核心概念，使传统的以用户为核心的大数据平台向以多租户为核心的大数据平台转变，更好的适应现代企业多租户应用环境，如图1所示。

帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
Hudi表概述 - MapReduce服务 MRS
Hudi表概述 - MapReduce服务 MRS

写时复制表也简称cow表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。 Merge

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
查看Spark应用调测结果 - MapReduce服务 MRS

Spark应用程序运行完成后，您可以查看运行结果数据，也可以通过Spark WebUI查看应用程序运行情况。操作步骤查看Spark应用运行结果数据。结果数据存储路径和格式已经与Spark应用程序指定，您可以通过指定文件中获取到运行结果数据。查看Spark应用程序运行情况。 Spark主要有两个Web页面。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 调测Spark应用
REFRESH TABLE - MapReduce服务 MRS
REFRESH TABLE - MapReduce服务 MRS

在执行此命令之前，应将旧表的表结构定义schema和数据复制到新数据库位置。对于旧版本仓库，源集群和目的集群的时区应该相同。新的数据库和旧数据库的名字应该相同。如果表是聚合表，则应将所有聚合表复制到新的数据库位置。如果旧集群使用HIVE元数据库来存储表结构，则刷新将不起作用，因为文件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
从零开始使用Sqoop - MapReduce服务 MRS

adoop（Hive）与传统的数据库（MySQL、PostgreSQL等）间进行数据的传递，可以将一个关系型数据库（例如：MySQL、Oracle、PostgreSQL等）中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据库中。前提条件创建集群时已勾选Sqoop组件以及依赖的服务。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Sqoop

总条数： 4010

上一页
1
...
93
94
95
...
201
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

启用MRS集群间拷贝功能 - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Scala） - MapReduce服务 MRS

install编译构建HBase Jar包失败报错Could not transfer artifact如何处理 - MapReduce服务 MRS

使用二次开发程序产生Unable to read HiveServer2异常如何处理 - MapReduce服务 MRS

Spark INSERT SELECT语句调优 - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Scala） - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Scala） - MapReduce服务 MRS

创建CarbonData表 - MapReduce服务 MRS

HBase应用开发规则 - MapReduce服务 MRS

HBase输入 - MapReduce服务 MRS

从零开始使用Spark SQL - MapReduce服务 MRS

Hudi表概述 - MapReduce服务 MRS

创建HBase权限角色 - MapReduce服务 MRS

ClickHouse应用程序开发思路 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

提交Spark任务到新增Task节点 - MapReduce服务 MRS

Hudi表概述 - MapReduce服务 MRS

查看Spark应用调测结果 - MapReduce服务 MRS

REFRESH TABLE - MapReduce服务 MRS

从零开始使用Sqoop - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线