搜索_华为云

使用Hue提交Oozie HDFS作业 - MapReduce服务 MRS

“/user{提交用户名}”目录，可能会导致其他任务运行异常。单击Oozie编辑器右上角的。保存前如果需要修改作业名称（默认为“My Workflow”），可以直接单击该名称进行修改，例如“HDFS-Workflow”。保存完成后，单击，提交该作业。作业提交后，可通过Hu

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Hue提交Oozie作业
使用Oozie客户端提交Hive任务 - MapReduce服务 MRS

使用Oozie客户端提交Hive任务操作场景该任务指导用户在使用Oozie客户端提交Hive任务 Hive任务有如下类型： Hive作业使用JDBC方式连接的Hive作业。 Hive2作业使用Beeline方式连接的Hive作业。本文以使用Oozie客户端提交Hive作业为例介绍。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Oozie客户端提交作业
基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

my.cnf [mysqld] server_id=1 log-bin=master binlog_format=row Maxwell需要连接MySQL，并创建一个名称为maxwell的数据库存储元数据，且需要能访问需要同步的数据库，所以建议新创建一个MySQL用户专门用来给M

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka常见问题
数据迁移 - MapReduce服务 MRS
数据迁移 - MapReduce服务 MRS

数据迁移数据迁移方案介绍数据迁移到MRS前信息收集数据迁移到MRS前网络准备使用CDM服务迁移Hadoop数据至MRS集群使用CDM服务迁移HBase数据至MRS集群使用CDM服务迁移Hive数据至MRS集群使用BulkLoad工具向HBase中批量导入数据使用CDM服务迁移MySQL数据至MRS

帮助中心 > MapReduce服务 MRS > 最佳实践
Spark动态分区插入场景内存优化 - MapReduce服务 MRS

Spark动态分区插入场景内存优化操作场景 SparkSQL在往动态分区表中插入数据时，分区数越多，单个Task生成的HDFS文件越多，则元数据占用的内存也越多。这就导致程序GC（Gabage Collection）严重，甚至发生OOM（Out of Memory）。经测试证

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

my.cnf [mysqld] server_id=1 log-bin=master binlog_format=row Maxwell需要连接MySQL，并创建一个名称为maxwell的数据库存储元数据，且需要能访问需要同步的数据库，所以建议新创建一个MySQL用户专门用来给M

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka常见问题
数据迁移到MRS前信息收集 - MapReduce服务 MRS

数据迁移到MRS前信息收集由于离线大数据搬迁有一定的灵活性，迁移前需要掌握现有集群的详细信息，以能够更好的进行迁移决策。业务信息调研大数据平台及业务的架构图。大数据平台和业务的数据流图（包括峰值和均值流量等）。识别平台数据接入源、大数据平台数据流入方式（实时数据上报、批量数据抽取）、分析平台数据流向。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Flink Jar作业提交SQL样例程序开发思路 - MapReduce服务 MRS

Flink Jar作业提交SQL样例程序开发思路场景说明当作业的SQL语句修改频繁时，可使用Flink Jar的方式提交Flink SQL语句，以减少用户工作量。本场景适用于MRS 3.2.1及以后版本。开发思路使用当前样例提交并执行指定的SQL语句，多个语句之间使用分号分隔。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Jar作业提交SQL样例程序
使用Hue提交Oozie Spark2x作业 - MapReduce服务 MRS

Workflow”），可以直接单击该名称进行修改，例如“Spark-Workflow”。保存完成后，单击，提交该作业。作业提交后，可通过Hue界面查看作业的详细信息、日志、进度等相关内容。父主题：使用Hue提交Oozie作业

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Hue提交Oozie作业
批量加载HBase数据并生成本地二级索引 - MapReduce服务 MRS

批量加载HBase数据并生成本地二级索引场景介绍 HBase本身提供了ImportTsv＆LoadIncremental工具来批量加载用户数据。当前提供了HIndexImportTsv来支持加载用户数据的同时可以完成对索引数据的批量加载。HIndexImportTsv继承了HB

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
Flink Jar作业提交SQL样例程序（Java） - MapReduce服务 MRS

Flink Jar作业提交SQL样例程序（Java）提交SQL的核心逻辑如下，目前只支持提交CREATE和INSERT语句。完整代码参见com.huawei.bigdata.flink.examples.FlinkSQLExecutor。 public class FlinkSQLExecutor

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Jar作业提交SQL样例程序
批量加载HBase数据并生成本地二级索引 - MapReduce服务 MRS

批量加载HBase数据并生成本地二级索引场景介绍 HBase本身提供了ImportTsv＆LoadIncremental工具来批量加载用户数据。当前提供了HIndexImportTsv来支持加载用户数据的同时可以完成对索引数据的批量加载。HIndexImportTsv继承了HB

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
Sqoop客户端使用实践 - MapReduce服务 MRS

doop(Hive)与传统的数据库(MySQL、PostgreSQL...)间进行数据的传递，可以将一个关系型数据库（例如：MySQL、Oracle、PostgreSQL等）中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据库中。前提条件 MRS 3

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
Flink Jar作业提交SQL样例程序（Java） - MapReduce服务 MRS

Flink Jar作业提交SQL样例程序（Java）提交SQL的核心逻辑如下，目前只支持提交CREATE和INSERT语句。完整代码参见com.huawei.bigdata.flink.examples.FlinkSQLExecutor。 public class FlinkSQLExecutor

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Jar作业提交SQL样例程序
Flink Jar作业提交SQL样例程序开发思路 - MapReduce服务 MRS

Flink Jar作业提交SQL样例程序开发思路场景说明当作业的SQL语句修改频繁时，可使用Flink Jar的方式提交Flink SQL语句，以减少用户工作量。本场景适用于MRS 3.2.1及以后版本。开发思路使用当前样例提交并执行指定的SQL语句，多个语句之间使用分号分隔。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Jar作业提交SQL样例程序
运行SparkSql作业 - MapReduce服务 MRS

运行SparkSql作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个SparkSql作业。 SparkSql作业用于查询和分析数据，包括SQL语句和Script脚本两种形式，如果SQL语句涉及敏感信息，也可使用脚本文件方式提交。用户可以在MRS管理

 帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
通过Sqoop读取MySQL数据并写parquet文件到OBS时失败 - MapReduce服务 MRS

通过Sqoop读取MySQL数据并写parquet文件到OBS时失败用户问题通过Sqoop读取MySQL数据，然后直接写到OBS，指定parquet格式时写入报错，不指定parquet时不报错。问题现象原因分析 parquet格式不支持hive3，用Hcatalog方式写入。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Sqoop
Sqoop如何连接MySQL - MapReduce服务 MRS

Sqoop如何连接MySQL 用户问题 Sqoop如何连接MySQL数据库。处理步骤在集群上安装客户端，查看客户端“sqoop/lib”目录下是否有MySQL驱动包。在客户端目录下加载环境变量。 source bigdata_env 执行Kerberos用户认证。如果集群

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Sqoop
创建数据连接 - MapReduce服务 MRS

String 参数解释：数据连接类型。约束限制：不涉及取值范围： RDS_POSTGRES：RDS服务PostgreSQL数据库 RDS_MYSQL：RDS服务MySQL数据库 gaussdb-mysql：云数据库GaussDB(for MySQL) 默认取值：不涉及 source_info

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 数据连接管理
批量写入Hudi表 - MapReduce服务 MRS

因此它的速度比UPSERT快。当数据源不包含更新数据时建议使用该操作，如果数据源中存在更新数据，则在数据湖中会出现重复数据。 BULK_INSERT（批量插入）：用于初始数据集加载，该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高的，但

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作

总条数： 4081

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hue提交Oozie HDFS作业 - MapReduce服务 MRS

使用Oozie客户端提交Hive任务 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

数据迁移 - MapReduce服务 MRS

Spark动态分区插入场景内存优化 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

数据迁移到MRS前信息收集 - MapReduce服务 MRS

Flink Jar作业提交SQL样例程序开发思路 - MapReduce服务 MRS

使用Hue提交Oozie Spark2x作业 - MapReduce服务 MRS

批量加载HBase数据并生成本地二级索引 - MapReduce服务 MRS

Flink Jar作业提交SQL样例程序（Java） - MapReduce服务 MRS

批量加载HBase数据并生成本地二级索引 - MapReduce服务 MRS

Sqoop客户端使用实践 - MapReduce服务 MRS

Flink Jar作业提交SQL样例程序（Java） - MapReduce服务 MRS

Flink Jar作业提交SQL样例程序开发思路 - MapReduce服务 MRS

运行SparkSql作业 - MapReduce服务 MRS

通过Sqoop读取MySQL数据并写parquet文件到OBS时失败 - MapReduce服务 MRS

Sqoop如何连接MySQL - MapReduce服务 MRS

创建数据连接 - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线