搜索_华为云

DBService配置文件丢失导致启动失败 - MapReduce服务 MRS

DBService配置文件丢失导致启动失败问题背景与现象节点异常下电，重启备DBService失败。原因分析查看/var/log/Bigdata/dbservice/DB/gaussdb.log日志没有内容。查看/var/log/Bigdata/dbservice/sc

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用DBservice
使用Loader从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

文本文件 “SEQUENCE_FILE”：导入文本文件并保存在“sequence file”文件格式 “BINARY_FILE”：以二进制流的方式导入文件，可以导入任何格式的文件 TEXT_FILE 压缩格式在下拉菜单中选择数据导入HDFS/OBS后保存文件的压缩格式，未配置或选择“NONE”表示不压缩数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
Loader基本原理 - MapReduce服务 MRS

进行了一些扩展，实现MRS与关系型数据库、文件系统之间交换“数据”、“文件”，同时也可以将数据从关系型数据库或者文件服务器导入到HDFS/HBase中，或者反过来从HDFS/HBase导出到关系型数据库或者文件服务器中。 Loader模型主要由Loader Client和Loader

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Loader
spark-shell执行SQL跨文件系统load数据到Hive表失败 - MapReduce服务 MRS

duce会报类找不到。处理步骤方案一：如果文件较小，则可以将默认长度设置得大于文件最大长度，例如最大的文件是95 MB，则设置： hive.exec.copyfile.maxsize=104857600 方案二：如果确实文件较大，需要使用distcp任务来提高数据迁移效率

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
集群外节点安装客户端上传HDFS文件失败 - MapReduce服务 MRS

集群外节点安装客户端上传HDFS文件失败用户问题集群外节点安装客户端使用hdfs命令上传文件失败。问题现象在集群节点上安装客户端，在该客户端使用hdfs命令上传一个文件，报如下错误：图1 上传文件报错原因分析从错误截图可以看到报错是no route to host，且报错信息里面有192

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
MRS集群用户权限模型 - MapReduce服务 MRS

提升权限管理的易用性和用户体验。 MRS集群权限模型由“用户－用户组－角色－权限”四类对象构成。图1 权限模型权限由组件侧定义，允许访问组件某个资源的能力。不同组件针对自己的资源，有不同的权限。例如： HDFS针对文件资源权限，有读、写、执行等权限。 HBase针对表资源权限，有创建、读、写等权限。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 集群用户权限概述
mapred-default.xml文件解析异常导致WebHCat启动失败 - MapReduce服务 MRS

mapred-default.xml文件解析异常导致WebHCat启动失败用户问题 MRS的Hive服务故障，重新启动后，Master2节点上的HiveServer和WebHCat进程启动失败，Master1节点进程正常。原因分析登录Master2节点，查看“/var/lo

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

小文件优化操作场景 Spark SQL表中，经常会存在很多小文件（大小远小于HDFS的块大小），每个小文件默认对应Spark中的一个Partition，即一个Task。在有很多小文件时，Spark会启动很多Task，此时当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数，严重影响系统性能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
输入文件数超出设置限制导致任务执行失败 - MapReduce服务 MRS

原因分析 MapReduce任务提交前对输入文件数的检查策略：在提交的MapReduce任务中，允许的最大输入文件数和HiveServer最大堆内存的比值，例如500000/4（默认值），表示每4GB堆内存最大允许500000个输入文件。在输入的文件数超出此限制时则会发生此错误。解决办法

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
使用Stream Load方式导入数据至Doris - MapReduce服务 MRS

由于Stream Load是同步的导入方式，所以不会在Doris系统中记录导入信息，用户无法异步通过查看导入命令看到Stream Load，需查看创建导入请求的返回值获取导入结果。取消数据导入用户无法手动取消Stream Load，Stream Load在超时或者导入错误后会被系统自动取消。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris数据导入
在Hue页面上传大文件失败 - MapReduce服务 MRS

在Hue页面上传大文件失败问题通过Hue页面上传大文件时，上传失败。回答不建议使用Hue文件浏览器上传大文件，大文件建议使用客户端通过命令上传。如果必须使用Hue上传，参考以下步骤修改Httpd的参数：以omm用户登录主管理节点。执行以下命令编辑“httpd.conf”配置文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue > Hue故障排除
使用Loader导入数据 - MapReduce服务 MRS

HDFS 文件类型在下拉菜单中选择数据导入HDFS后保存文件的文件类型。 “TEXT_FILE”：导入文本文件并保存为文本文件。 “SEQUENCE_FILE”：导入文本文件并保存为sequence file文件格式。 “BINARY_FILE”：以二进制流的方式导入文件，可以导入任何格式的文件，不对文件做任何处理。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
ClickHouse数据导入导出 - MapReduce服务 MRS

ClickHouse数据导入导出本章节主要介绍使用ClickHouse客户端导入导出文件数据的基本语法和使用说明。使用ClickHouse客户端导入导出数据 CSV格式数据导入 clickhouse client --host 主机名/ClickHouse实例IP地址 --database

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入
使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

使用BulkLoad工具批量导入HBase数据操作场景您可以按照自定义的方式，通过命令批量导入数据到HBase中并创建索引。您可以在“configuration.xml”文件中定义多个方式来批量导入数据，导入数据时可不创建索引。列的名称不能包含特殊字符，只能由字母、数字和下划线组成。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
配置ClickHouse对接HDFS源文件（MRS 3.2.0-LTS） - MapReduce服务 MRS

rpc.port”的值。访问的HDFS文件路径：如果是访问的多个文件，需要指定到文件夹后边加上*号，如：hdfs://{namenode_ip}:{dfs.namenode.rpc.port}/tmp/* 父主题： ClickHouse数据导入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入
配置Spark作业失败时清理残留文件 - MapReduce服务 MRS

配置Spark作业失败时清理残留文件本章节仅适用于MRS 3.3.1-LTS及之后版本。配置场景 Spark作业失败时可能出现文件残留的情况，可能会长期积累导致磁盘空间告警，因此需要定时清理。使用约束本特性需要启动Spark JDBCServer服务，借助JDBCServ

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
典型场景：从FTP服务器导入数据到HBase - MapReduce服务 MRS

各个map的输入文件。选择“FILE”，表示按文件分割源文件，即每个map处理一个或多个完整的源文件，同一个源文件不可分配至不同map，完成数据导入后保持源文件的目录结构。选择“SIZE”，表示按大小分割源文件，即每个map处理一定大小的输入文件，同一个源文件可分割至多个ma

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
Hudi表模型设计规范 - MapReduce服务 MRS

中存在的MOR和COW两种模型中，MOR表的流式读写性能相对较好，因此在流式计算场景下采用MOR表模型。关于MOR表在读写性能的对比关系如下：对比维度 MOR表 COW表流式写高低流式读高低批量写高低批量读低高实时入湖，表模型采用MOR表。实时入湖一

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

使用BulkLoad工具批量导入HBase数据操作场景您可以按照自定义的方式，通过命令批量导入数据到HBase中并创建索引。您可以在“configuration.xml”文件中定义多个方式来批量导入数据。导入数据时可不创建索引。列的名称不能包含特殊字符，只能由字母、数字和下划线组成。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
典型场景：从SFTP服务器导入数据到Hive - MapReduce服务 MRS

/opt/tempfile;/opt 文件分割方式选择按文件或大小分割源文件，作为数据导入的MapReduce任务中各个map的输入文件。选择“FILE”，表示按文件分割源文件，即每个map处理一个或多个完整的源文件，同一个源文件不可分配至不同map，完成数据导入后保持源文件的目录结构。选择“

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入

总条数： 4242

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DBService配置文件丢失导致启动失败 - MapReduce服务 MRS

使用Loader从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

Loader基本原理 - MapReduce服务 MRS

spark-shell执行SQL跨文件系统load数据到Hive表失败 - MapReduce服务 MRS

集群外节点安装客户端上传HDFS文件失败 - MapReduce服务 MRS

MRS集群用户权限模型 - MapReduce服务 MRS

mapred-default.xml文件解析异常导致WebHCat启动失败 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

输入文件数超出设置限制导致任务执行失败 - MapReduce服务 MRS

使用Stream Load方式导入数据至Doris - MapReduce服务 MRS

在Hue页面上传大文件失败 - MapReduce服务 MRS

使用Loader导入数据 - MapReduce服务 MRS

ClickHouse数据导入导出 - MapReduce服务 MRS

使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

配置ClickHouse对接HDFS源文件（MRS 3.2.0-LTS） - MapReduce服务 MRS

配置Spark作业失败时清理残留文件 - MapReduce服务 MRS

典型场景：从FTP服务器导入数据到HBase - MapReduce服务 MRS

Hudi表模型设计规范 - MapReduce服务 MRS

使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到Hive - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线