搜索_华为云

HBase Java API接口介绍 - MapReduce服务 MRS

返回：输送的总的数据批数 getLogReadInBytes() 返回类型：long 返回：从wal日志读取的总字节数 getLogEditsRead() 返回类型：long 返回：从wal日志读取的总编辑数 getSizeOfLogToReplicate() 返回类型：long 返回：在队

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发常见问题 > HBase接口介绍
HDFS开源增强特性 - MapReduce服务 MRS

e列表。开启读取的HDFS Load Balance功能时，NameNode会在原先网络拓扑距离排序的基础上，根据每个节点的平均I/O负载情况进行顺序调整，把高I/O负载的节点顺序调整至后面。 HDFS开源增强特性：HDFS冷热数据迁移 Hadoop历来主要被用于批量处理大规模的

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

0-LTS及之后版本支持在创建集群时配置LakeFormation数据连接。组件选择必须包含Hadoop、Ranger、Hive、Guardian、Spark（可选）、Flink（可选）等组件。例如，配置如下图所示，不同版本集群可能存在差异，具体界面显示以实际为准。元数据选择“外置数据连接”，并配置以下参数：

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接 > MRS对接LakeFormation云服务
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

查询使用以“cn”结尾的邮箱的员工信息。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。提供类似SQL的Hive Query Language语言操作结构化数据，其基本原理是将HQL语言自动转换成MapR

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Flume业务模型配置说明 - MapReduce服务 MRS

Flume业务配置及模块选择过程中，一般要求Sink的极限吞吐量需要大于Source的极限吞吐量，否则在极限负载的场景下，Source往Channel的写入速度大于Sink从Channel取出的速度，从而导致Channel频繁被写满，进而影响性能表现。 Avro Source和Avro Sink一般都是成对出现，用于多个Flume

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
查询作业列表信息 - MapReduce服务 MRS

arkSubmit。 HiveScript HiveSql DistCp，导入、导出数据。 SparkScript SparkSql Flink 默认取值：不涉及 job_state 否 String 参数解释：作业运行状态。约束限制：不涉及取值范围： FAILED：失败

 帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 作业管理接口
快速使用IoTDB - MapReduce服务 MRS
快速使用IoTDB - MapReduce服务 MRS

一体化的数据管理引擎。它具有体量轻、性能高、易使用的特点，支持对接Hadoop与Spark生态，适用于工业物联网应用中海量时间序列数据高速写入和复杂分析查询的需求。背景信息假定某某集团旗下有3个生产线，每个生产线上有5台设备，传感器会实时采集这些设备的指标数据（例如温度、速度

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB
spark-beeline查询Hive视图报错 - MapReduce服务 MRS

原因分析转换格式失败，spark-sql使用其内置的Metastore，而不是Hive中使用的Metastore，所以读取元数据时失败，spark-sql内部读取的是Partque格式的数据，而Hive中默认是ORC的。处理步骤登录Spark客户端节点，执行如下命令，进入spark-sql：

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
编包并运行Spark应用 - MapReduce服务 MRS

rIp:21007，普通群格式为brokerIp:9092，<topic>指读取Kafka上的topic名称，<batchTime>指Streaming分批的处理间隔。 Spark Streaming读取Kafka 0-10代码样例：安全集群任务提交命令： bin/spark-submit

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 调测Spark应用
ALM-50215 FE Thrift各个方法接收的RPC请求中最长的耗时超过阈值 - MapReduce服务 MRS

联系网络管理员恢复网络。在FusionInsight Manager界面，选择“集群 > 服务 > Doris”，在左侧图表分类中单击“连接”，查看“FE的MySQL端口连接数”监控图表，如果连接数较大；选择“实例 > FE > 图表”，在左侧图表分类中单击“CPU和内存”，查看“FE的CPU使用率”

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark Streaming调优 - MapReduce服务 MRS

现数据丢失。 ReliableKafkaReceiver：通过ZooKeeper记录接收数据位移。 DirectKafka：直接通过RDD读取Kafka每个Partition中的数据，数据高可靠。从实现上来看，DirectKafka的性能会是最好的，实际测试上来看，Direct

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优
配置parquet表的压缩格式 - MapReduce服务 MRS

compression”配置项是无效的，因为它会读取“spark.sql.parquet.compression.codec”配置项的值。当“spark.sql.parquet.compression.codec”未做设置时默认值为“snappy”，“parquet.compression”会读取该默认值。因此，“spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

0-LTS及之后版本支持在创建集群时配置LakeFormation数据连接。组件选择必须包含Hadoop、Ranger、Hive、Guardian、Spark（可选）、Flink（可选）等组件。例如，配置如下图所示，不同版本集群可能存在差异，具体界面显示以实际为准。元数据选择“外置数据连接”，并配置以下参数：

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据 > 配置LakeFormation数据连接
新增并执行作业 - MapReduce服务 MRS

arkSubmit。 HiveScript HiveSql DistCp，导入、导出数据。 SparkScript SparkSql Flink 默认取值：不涉及 job_name 是 String 参数解释：作业名称。约束限制：不涉及取值范围：只能由英文字母、数字以

 帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 作业管理接口
LOAD - MapReduce服务 MRS
LOAD - MapReduce服务 MRS

Filepath：需要填写文件或目录的绝对路径。 OVERWRITE：如果使用了这个关键字，目标表（或分区）的数据将被删除，并使用文件中读取的数据来替代。限制如果要加载数据到指定分区，用户必须在partition子句中列出表的所有字段。不支持复杂类型数据，比如Array，Map等。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DML SQL语法说明
配置parquet表的压缩格式 - MapReduce服务 MRS

compression”配置项是无效的，因为它会读取“spark.sql.parquet.compression.codec”配置项的值。当“spark.sql.parquet.compression.codec”未做设置时默认值为“snappy”，“parquet.compression”会读取该默认值。因此，“spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
ALM-50219 当前查询执行线程池等待队列的长度超过阈值 - MapReduce服务 MRS

查看任务执行情况。在FusionInsight Manager界面，选择“集群 > 服务 > Doris”，在左侧图表分类中单击“连接”，查看“FE的MySQL端口连接数”监控图表，如果连接数较大；选择“实例 > FE > 图表”，在左侧图表分类中单击“CPU和内存”，查看“FE的CPU使用率”

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
元数据导出 - MapReduce服务 MRS
元数据导出 - MapReduce服务 MRS

Hive表数据存储在HDFS上，表数据及表数据的元数据由HDFS统一按数据目录进行迁移。而Hive表的元数据根据集群的不同配置，可以存储在不同类型的关系型数据库中（如MySQL、PostgreSQL、Oracle等）。本指导中导出的Hive表元数据即存储在关系型数据库中的Hive表的描述信息。业界主流大数据

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移 > 数据迁移方案介绍
查看HetuEngine实例监控页面 - MapReduce服务 MRS

ILED Rows Task读取的总数据条数，单位为千（k）、百万（M），通过分析相同Stage阶段不同Task读取的条数可以快速判断当前任务是否存在数据倾斜 Rows/s Task每秒钟读取的数据条数，通过分析相同Stage阶段不同Task每秒钟读取数据条数可以快速判断节点是否

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 管理HetuEngine计算实例
Impala应用开发建议 - MapReduce服务 MRS

OBS数据存储场景可根据业务需求配置本地缓存，提升读取速率，配置单盘100GB本地缓存示例：—data_cache=/srv/BigData/data1/impala:100GB HDFS存储开启短路读 HDFS存储场景下可开启短路读，提升读取速率，具体请参考：https://impala

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Impala应用开发规范

总条数： 1008

上一页
1
...
43
44
45
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HBase Java API接口介绍 - MapReduce服务 MRS

HDFS开源增强特性 - MapReduce服务 MRS

创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

Flume业务模型配置说明 - MapReduce服务 MRS

查询作业列表信息 - MapReduce服务 MRS

快速使用IoTDB - MapReduce服务 MRS

spark-beeline查询Hive视图报错 - MapReduce服务 MRS

编包并运行Spark应用 - MapReduce服务 MRS

ALM-50215 FE Thrift各个方法接收的RPC请求中最长的耗时超过阈值 - MapReduce服务 MRS

Spark Streaming调优 - MapReduce服务 MRS

配置parquet表的压缩格式 - MapReduce服务 MRS

创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

新增并执行作业 - MapReduce服务 MRS

LOAD - MapReduce服务 MRS

配置parquet表的压缩格式 - MapReduce服务 MRS

ALM-50219 当前查询执行线程池等待队列的长度超过阈值 - MapReduce服务 MRS

元数据导出 - MapReduce服务 MRS

查看HetuEngine实例监控页面 - MapReduce服务 MRS

Impala应用开发建议 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线