搜索_华为云

使用Loader从SFTP服务器导入数据到Hive - MapReduce服务 MRS

选择按文件或大小分割源文件，作为数据导入的MapReduce任务中各个map的输入文件。选择“FILE”，表示按文件分割源文件，即每个map处理一个或多个完整的源文件，同一个源文件不可分配至不同map，完成数据导入后保持源文件的目录结构。选择“SIZE”，表示按大小分割源文件，即每个map处理一定

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
BulkLoad工具配置文件说明 - MapReduce服务 MRS

</composite> 指定字段数据类型 HBase BulkLoad支持读取原生态数据文件，把数据文件的每个字段映射为HBase定义的字段，并对该字段的数据类型做定义。您可以在“configuration.xml”文件中定义多个方式来批量导入数据。列的名称不能包含特殊字符，只能由字母、数字和下划线组成。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

确保集群安装完成，包括HDFS、Yarn、Spark和Kafka。本地新建文件“input_data1.txt”，将“log1.txt”的内容复制保存到“input_data1.txt”。在客户端安装节点下创建文件目录：“/home/data”。将上述文件上传到此“/home/data”目录下。将ka

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming对接kafka0-10程序
使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

“RENAME”：重命名新文件。无扩展名的文件直接增加字符串后缀，有扩展名的文件在文件名增加字符串后缀。字符串具有唯一性。 “APPEND”：在旧文件尾部合并新文件内容。合并操作只是简单的追加，不保证追加文件是否可以使用。例如文本文件可合并，压缩文件合并后可能无法使用。 “IGNORE”：保留旧文件，不复制新文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
配置Spark读取HBase表数据 - MapReduce服务 MRS

配置Spark读取HBase表数据操作场景 Spark on HBase为用户提供了在Spark SQL中查询HBase表，通过Beeline工具为HBase表进行存数据等操作。通过HBase接口可实现创建表、读取表、往表中插入数据等操作。 Spark On HBase 登录Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
开发Oozie配置文件 - MapReduce服务 MRS

开发Oozie配置文件 Oozie样例程序开发思路 Oozie应用开发步骤父主题：开发Oozie应用

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（普通模式） > 开发Oozie应用
开发Oozie配置文件 - MapReduce服务 MRS

开发Oozie配置文件 Oozie样例程序开发思路 Oozie应用开发步骤父主题：开发Oozie应用

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（安全模式） > 开发Oozie应用
开发Oozie配置文件 - MapReduce服务 MRS

开发Oozie配置文件 Oozie样例程序开发思路 Oozie应用开发步骤父主题：开发Oozie应用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（安全模式） > 开发Oozie应用
通过客户端hadoop jar命令提交任务后返回“GC overhead”报错 - MapReduce服务 MRS

从报错堆栈可以看出是任务在提交过程中分片时在读取HDFS文件阶段内存溢出了，一般是由于该任务要读取的小文件很多导致内存不足。解决办法排查启动的MapReduce任务是否对应的HDFS文件个数很多，如果很多，减少文件数量，提前先合并小文件或者尝试使用combineInputFormat来减少任务读取的文件数量。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Yarn
配置Spark读取HBase表数据 - MapReduce服务 MRS

配置Spark读取HBase表数据 Spark On HBase Spark on HBase为用户提供了在Spark SQL中查询HBase表，通过Beeline工具为HBase表进行存数据等操作。通过HBase接口可实现创建表、读取表、往表中插入数据等操作。登录Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化创建目录写文件追加文件内容读文件

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 开发HDFS应用
配置Hive读取Hudi表 - MapReduce服务 MRS

配置Hive读取Hudi表 Hudi表对应的Hive外部表介绍 Hudi源表对应一份HDFS的数据，通过Spark组件、Flink组件或者Hudi客户端，可以将Hudi表的数据映射为Hive外部表，基于该外部表，Hive可以进行实时视图查询、读优化视图查询以及增量视图查询。根据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
开发Oozie配置文件 - MapReduce服务 MRS

开发Oozie配置文件 Oozie样例程序开发思路 Oozie应用开发步骤父主题：开发Oozie应用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > 开发Oozie应用
典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

删除临时路径的文件。转移临时文件存在同名文件时有以下行为： “OVERRIDE”：直接覆盖旧文件。 “RENAME”：重命名新文件。无扩展名的文件直接增加字符串后缀，有扩展名的文件在文件名增加字符串后缀。字符串具有唯一性。 “APPEND”：在旧文件尾部合并新文件内容。合并操作只

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
ALM-12054 证书文件失效（2.x及以前版本） - MapReduce服务 MRS

ALM-12054 证书文件失效（2.x及以前版本）告警解释系统在每天二十三点检查当前系统中的证书文件是否失效（即当前集群中的证书文件是否过期，或者尚未生效）。如果证书文件失效，产生该告警。当重新导入一个正常证书，并且状态不为失效状态，该告警恢复。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
读取Hudi cow表视图 - MapReduce服务 MRS

读取Hudi cow表视图实时视图读取（Hive，SparkSQL为例）：直接读取Hive里面存储的Hudi表即可，${table_name}表示表名称。 select count(*) from ${table_name}; 实时视图读取（Spark dataSource A

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi读操作
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化创建目录写文件追加文件内容读文件

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 开发HDFS应用
通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

test”目录下是否有产生数据。图8 查看HDFS文件如上所示，文件目录下产生了收集的日志文件，文件名统一增加了前缀“over_”。下载日志文件“over_log1.txt”并查看内容，与写入的日志文件“log1.txt”内容一致。 Test log file 1!!! 父主题：

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
配置Spark小文件自动合并 - MapReduce服务 MRS

配置Spark小文件自动合并配置场景小文件自动合并特性开启后，Spark将数据先写入临时目录，再去检测每个分区的平均文件大小是否小于16MB（默认值）。如果发现平均文件大小小于16MB，则认为分区下有小文件，Spark会启动一个Job合并这些小文件，并将合并后的大文件写入到最终的表目录下。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化创建目录写文件追加文件内容读文件

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用

总条数： 3127

上一页
1
...
5
6
7
...
157
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Loader从SFTP服务器导入数据到Hive - MapReduce服务 MRS

BulkLoad工具配置文件说明 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

配置Spark读取HBase表数据 - MapReduce服务 MRS

开发Oozie配置文件 - MapReduce服务 MRS

开发Oozie配置文件 - MapReduce服务 MRS

开发Oozie配置文件 - MapReduce服务 MRS

通过客户端hadoop jar命令提交任务后返回“GC overhead”报错 - MapReduce服务 MRS

配置Spark读取HBase表数据 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

配置Hive读取Hudi表 - MapReduce服务 MRS

开发Oozie配置文件 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

ALM-12054 证书文件失效（2.x及以前版本） - MapReduce服务 MRS

读取Hudi cow表视图 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

配置Spark小文件自动合并 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线