搜索_华为云

典型场景：从SFTP服务器导入数据到HBase - MapReduce服务 MRS

入文件。选择“FILE”，表示按文件分割源文件，即每个map处理一个或多个完整的源文件，同一个源文件不可分配至不同map，完成数据导入后保持源文件的目录结构。选择“SIZE”，表示按大小分割源文件，即每个map处理一定大小的输入文件，同一个源文件可分割至多个map，数据保存至

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
使用Loader从SFTP服务器导入数据到HBase - MapReduce服务 MRS

入文件。选择“FILE”，表示按文件分割源文件，即每个map处理一个或多个完整的源文件，同一个源文件不可分配至不同map，完成数据导入后保持源文件的目录结构。选择“SIZE”，表示按大小分割源文件，即每个map处理一定大小的输入文件，同一个源文件可分割至多个map，数据保存至

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

kers>指获取元数据的Kafka地址，<topic>指读取Kafka上的topic名称，<batchTime>指Streaming分批的处理间隔。由于Spark Streaming Kafka的依赖包在客户端的存放路径与其他依赖包不同，如其他依赖包路径为“$SPARK_HOME/jars”，而Spark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Flume日志介绍 - MapReduce服务 MRS
Flume日志介绍 - MapReduce服务 MRS

运行日志 FATAL FATAL表示系统运行的致命错误信息。 ERROR ERROR表示系统运行的错误信息。 WARN WARN表示当前事件处理存在异常信息。 INFO INFO表示记录系统及各事件正常运行状态信息。 DEBUG DEBUG表示记录系统及系统的调试信息。如果您需要修改日志级别，请执行如下操作：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume运维管理
CarbonData常见配置参数 - MapReduce服务 MRS

carbon.enable.badrecord.action.redirect false 是否在数据加载中开启redirect方式来处理bad records。启用该配置后，源文件中的bad records会被记录在指定存储位置生成的CSV文件中。在Windows操作系统中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本）
Flume日志介绍 - MapReduce服务 MRS
Flume日志介绍 - MapReduce服务 MRS

运行日志 FATAL FATAL表示系统运行的致命错误信息。 ERROR ERROR表示系统运行的错误信息。 WARN WARN表示当前事件处理存在异常信息。 INFO INFO表示记录系统及各事件正常运行状态信息。 DEBUG DEBUG表示记录系统及系统的调试信息。如果您需要修改日志级别，请执行如下操作：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

FemaleInfoCollectionPrint： // 参数解析: // <batchTime>为Streaming分批的处理间隔。 // <windowTime>为统计数据的时间跨度,时间单位都是秒。 // <topics>为Kafka中订阅的主题，多以逗号分隔。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming程序
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

kers>指获取元数据的Kafka地址，<topic>指读取Kafka上的topic名称，<batchTime>指Streaming分批的处理间隔。由于Spark Streaming Kafka的依赖包在客户端的存放路径与其他依赖包不同，如其他依赖包路径为“$SPARK_HOME/jars”，而Spark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Flink性能调优建议 - MapReduce服务 MRS

MiniBatch聚合的核心思想是将一组输入的数据缓存在聚合算子内部的缓冲区中。当输入的数据被触发处理时，每个key只需一个操作即可访问状态，可以很大程度减少状态开销并获得更好的吞吐量。但是可能会增加一些延迟，因为它会缓冲一些记录而不是立即处理，这是吞吐量和延迟之间的权衡。默认未开启该功能。 API方式： //

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
Hive CBO原理介绍 - MapReduce服务 MRS

colum_a='value1'; 则估算查询的最终条数为1000000 * 1/50 = 20000条，选择率为2%。以下以TPC-DS Q3为例来介绍CBO是如何调整Join顺序的。 select dt.d_year, item.i_brand_id brand_id,

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
使用多级agent串联从本地采集静态日志保存到HDFS - MapReduce服务 MRS

/srv/BigData/hadoop/data1/flumeserver/checkpoint transactionCapacity 事务大小：即当前channel支持事务处理的事件个数。建议和Source的batchSize设置为同样大小，不能小于batchSize。 61200 hdfs.path 写入HDFS的目录，此参数不能为空。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume加密传输数据采集任务
Oozie客户端配置说明 - MapReduce服务 MRS

l-9.2.22.v20170606.jar 普通模式下，上传过程如果遇到“Permission denied”的问题，可执行以下命令进行处理。 su - omm source /opt/client/bigdata_env hdfs dfs -chmod -R 777 /user/oozie

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Oozie客户端提交作业
Hue日志介绍 - MapReduce服务 MRS
Hue日志介绍 - MapReduce服务 MRS

级越高，打印出来的日志就越少。表2 日志级别级别描述 ERROR ERROR表示系统运行的错误信息。 WARN WARN表示当前事件处理存在异常信息。 INFO INFO表示记录系统及各事件正常运行状态信息。 DEBUG DEBUG表示记录系统及系统的调试信息。如果您需要修改日志级别，请执行如下操作：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue
JobGateway日志介绍 - MapReduce服务 MRS

级越高，打印出来的日志就越少。表2 日志级别级别描述 ERROR ERROR表示系统运行的错误信息。 WARN WARN表示当前事件处理存在异常信息。 INFO INFO表示记录系统及各事件正常运行状态信息。 DEBUG DEBUG表示记录系统及系统的调试信息。如果您需要修改日志级别，请执行如下操作：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用JobGateway
Flink作业大小表Join能力增强 - MapReduce服务 MRS

JOIN时小表为右表。 Flink作业大小表Join去重在双流关联的业务模型中，关联算子接收到其中一个流发送的大量重复数据，则会导致下游算子需要处理大量重复数据，影响作业性能。如A表字段（P1，A1，A2）使用如下方式关联B表字段（P1，B1，B2，B3）生成C的场景中，B表信息发生

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
Spark SQL join优化 - MapReduce服务 MRS

计算5分钟，超过5分钟该任务会出现超时异常，而这个时候被广播的表的broadcast任务依然在执行，造成资源浪费。这种情况下，有两种方式处理：调整“spark.sql.broadcastTimeout”的数值，加大超时的时间限制。降低“spark.sql.autoBroad

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
使用Loader从FTP服务器导入数据到HBase - MapReduce服务 MRS

入文件。选择“FILE”，表示按文件分割源文件，即每个map处理一个或多个完整的源文件，同一个源文件不可分配至不同map，完成数据导入后保持源文件的目录结构。选择“SIZE”，表示按大小分割源文件，即每个map处理一定大小的输入文件，同一个源文件可分割至多个map，数据保存至

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
使用多级agent串联从本地采集静态日志保存到HDFS - MapReduce服务 MRS

/srv/BigData/hadoop/data1/flumeserver/checkpoint transactionCapacity 事务大小：即当前channel支持事务处理的事件个数。建议和Source的batchSize设置为同样大小，不能小于batchSize。 61200 hdfs.path 写入HDFS的目录，此参数不能为空。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > 配置Flume加密传输数据采集任务
HDFS HA方案介绍 - MapReduce服务 MRS

配置在两台独立的机器上。在任何一个时间点，只有一个NameNode处于Active状态，另一个处于Standby状态。Active节点负责处理所有客户端操作，Standby节点时刻保持与Active节点同步的状态以便在必要时进行快速主备切换。为保持Active和Standby节

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
配置HDFS DataNode数据均衡 - MapReduce服务 MRS

系统选择所有DataNode节点中偏差最多的数据量作为迁移的总数据量。 Balancer的迁移是按迭代（iteration）方式串行顺序处理的，每个iteration迁移数据量不超过10GB，每个iteration重新计算使用率的情况。因此针对集群情况，可以大概估算每个ite

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS

总条数： 2442

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景：从SFTP服务器导入数据到HBase - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HBase - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Flume日志介绍 - MapReduce服务 MRS

CarbonData常见配置参数 - MapReduce服务 MRS

Flume日志介绍 - MapReduce服务 MRS

Scala样例代码 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Flink性能调优建议 - MapReduce服务 MRS

Hive CBO原理介绍 - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HDFS - MapReduce服务 MRS

Oozie客户端配置说明 - MapReduce服务 MRS

Hue日志介绍 - MapReduce服务 MRS

JobGateway日志介绍 - MapReduce服务 MRS

Flink作业大小表Join能力增强 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

使用Loader从FTP服务器导入数据到HBase - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HDFS - MapReduce服务 MRS

HDFS HA方案介绍 - MapReduce服务 MRS

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线