搜索_华为云

Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
配置SparkSQL的分块个数 - MapReduce服务 MRS

配置SparkSQL的分块个数配置场景 SparkSQL在进行shuffle操作时默认的分块数为200。在数据量特别大的场景下，使用默认的分块数就会造成单个数据块过大。如果一个任务产生的单个shuffle数据块大于2G，该数据块在被fetch的时候还会报类似错误： Adjusted

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
使用Hue提交Oozie Java作业 - MapReduce服务 MRS

使用Hue提交Oozie Java作业操作场景该任务指导用户通过Hue界面提交Java类型的Oozie作业。操作步骤创建工作流，请参考使用Hue创建工作流。在工作流编辑页面，选择“Java 程序”按钮，将其拖到操作区中。在弹出的“Java program”窗口中配置“Jar

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Oozie > 使用Hue提交Oozie作业
创建HDFS文件并写入内容 - MapReduce服务 MRS

创建HDFS文件并写入内容功能简介写文件过程为：使用FileSystem实例的create方法获取写文件的输出流。使用该输出流将内容写入到HDFS的指定文件中。在写完文件后，需关闭所申请资源。代码样例如下是写文件的代码片段，详细代码请参考com.huawei.bigdata.hdfs.examples

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
Spark增量读取Hudi参数规范 - MapReduce服务 MRS

Spark增量读取Hudi参数规范规则增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例 set hoodie.tableName.consume.mode=INCREMENTAL

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
组件WebUI便捷访问 - MapReduce服务 MRS

组件WebUI便捷访问大数据组件都有自己的WebUI页面管理自身系统，但是由于网络隔离的原因，用户并不能很简便地访问到该页面。例如访问HDFS的WebUI页面，传统的操作方法是需要用户创建ECS，使用ECS远程登录组件的UI，这使得组件的页面UI访问很是繁琐，对于很多初次接触大数据的用户很不友好

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
按需计费 - MapReduce服务 MRS
按需计费 - MapReduce服务 MRS

按需计费按需计费是一种先使用再付费的计费模式，适用于无需任何预付款或长期承诺的用户。本文将介绍按需计费MRS集群的计费规则。适用场景集群用于前期程序研发或功能测试。资源使用有临时性和突发性。计费周期按需计费MRS集群按秒计费，每一个小时整点结算一次费用（以UTC+8时间为准

 帮助中心 > MapReduce服务 MRS > 计费说明 > 计费模式
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
二进制函数和运算符 - MapReduce服务 MRS

二进制函数和运算符二进制运算符 || 运算符执行连接。二进制函数 length(binary) → bigint 返回binary的字节长度。 select length(x'00141f');-- 3 concat(binary1, ..., binaryN) → varbinary

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Flink应用开发常用概念 - MapReduce服务 MRS

Flink应用开发常用概念 DataStream 数据流，是指Flink系统处理的最小数据单元。该数据单元最初由外部系统导入，可以通过socket、Kafka和文件等形式导入，在Flink系统处理后，通过Socket、Kafka和文件等输出到外部系统，这是Flink的核心概念。 Data

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发概述
使用CDM服务迁移数据至MRS HDFS时任务运行失败 - MapReduce服务 MRS

使用CDM服务迁移数据至MRS HDFS时任务运行失败用户问题使用CDM从旧的集群迁移数据至新集群的HDFS过程失败。问题现象使用CDM从源HDFS导入目的端HDFS，发现目的端MRS集群故障，NameNode无法启动。查看日志发现在启动过程中存在“Java heap space

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
SHOW_COMMIT_FILES - MapReduce服务 MRS
SHOW_COMMIT_FILES - MapReduce服务 MRS

SHOW_COMMIT_FILES 本章节仅适用于MRS 3.3.0及之后版本。命令功能查看指定的instant一共更新或者插入了多少个文件。命令格式 call show_commit_files(table=>'[table]', instant_time=>'[instant_time

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
配置Hive Python3样例工程 - MapReduce服务 MRS

配置Hive Python3样例工程操作场景为了运行MRS产品Hive组件的Python3接口样例代码，需要完成下面的操作。操作步骤客户端机器必须安装有Python3，其版本不低于3.6，最高不能超过3.8。在客户端机器的命令行终端输入python3可查看Python版本号

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

Doris建表规范该章节主要介绍创建Doris表时需遵循的规则和建议。 Doris建表规则在创建Doris表指定分桶buckets时，每个桶的数据大小应保持在100MB~3GB之间，单分区中最大分桶数量不超过5000。表数据超过5亿条以上必须设置分区分桶策略。表的分桶列不要设置太多

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
CarbonData - MapReduce服务 MRS
CarbonData - MapReduce服务 MRS

CarbonData CarbonData是一种新型的Apache Hadoop本地文件格式，使用先进的列式存储、索引、压缩和编码技术，以提高计算效率，有助于加速超过PB数量级的数据查询，可用于更快的交互查询。同时，CarbonData也是一种将数据源与Spark集成的高性能分析引擎

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Hive on Hue - MapReduce服务 MRS
Hive on Hue - MapReduce服务 MRS

Hive on Hue Hue提供了Hive图形化管理功能，使用户可以通过界面的方式查询Hive的不同数据。查询编辑器使用介绍访问Hue WebUI，请参考访问Hue WebUI界面。在左侧导航栏单击编辑器，然后选择“Hive”，进入“Hive”。执行Hive HQL语句

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本） > 使用Hue WebUI典型场景
准备本地应用开发环境 - MapReduce服务 MRS

准备本地应用开发环境 Hive组件可以使用JDBC、HCatalog、Python、Python3接口进行应用开发。准备JDBC/HCatalog开发环境表1 JDBC/HCatalog开发环境准备项说明操作系统开发环境：Windows系统，支持Windows7以上版本

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 准备Hive应用开发环境

总条数： 5359

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

使用Hue提交Oozie Java作业 - MapReduce服务 MRS

创建HDFS文件并写入内容 - MapReduce服务 MRS

Spark增量读取Hudi参数规范 - MapReduce服务 MRS

组件WebUI便捷访问 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

按需计费 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

二进制函数和运算符 - MapReduce服务 MRS

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

Flink应用开发常用概念 - MapReduce服务 MRS

使用CDM服务迁移数据至MRS HDFS时任务运行失败 - MapReduce服务 MRS

SHOW_COMMIT_FILES - MapReduce服务 MRS

配置Hive Python3样例工程 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

CarbonData - MapReduce服务 MRS

Hive on Hue - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线