搜索_华为云

使用Spark执行Hudi样例程序（Scala） - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Scala）下面代码片段仅为演示，具体代码参见：com.huawei.bigdata.hudi.examples.HoodieDataSourceExample。插入数据： def insertData(spark: SparkSession

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
ClickHouse客户端执行SQL查询时报内存不足如何处理？ - MapReduce服务 MRS

ClickHouse客户端执行SQL查询时报内存不足如何处理？问题现象 ClickHouse会限制group by使用的内存量，在使用ClickHouse客户端执行SQL查询时报如下错误： Progress: 1.83 billion rows, 85.31 GB (68.80

帮助中心 > MapReduce服务 MRS > 常见问题 > 客户端使用类
Spark SQL企业级能力增强 - MapReduce服务 MRS

Spark SQL企业级能力增强配置矢量化读取ORC数据配置过滤掉分区表中路径不存在的分区配置Drop Partition命令支持批量删除配置Hive表分区动态覆盖配置Spark SQL开启Adaptive Execution特性父主题：使用Spark/Spark2x

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
Storm-Kafka开发指引 - MapReduce服务 MRS

//setSecurityPlugin(conf); if (args.length >= 2) { // 用户更改了默认的keytab文件名，这里需要将新的keytab文件名通过参数传入 conf.put(Config.TOPOLOGY_KEYTAB_FILE, args[1]); } //

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

diskbalancer -plan <Hostname| IP Address> 此条命令可以根据传入的DataNode生成一个Json文件，该文件包含了数据移动的源磁盘、目标磁盘、待移动的块等信息。同时，该命令还支持指定一些其他网络带宽参数等。 hdfs diskbalancer

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Oozie Shell接口介绍 - MapReduce服务 MRS

接口参数说明命令参数含义 oozie version 无显示Oozie版本信息 oozie job -config <arg> 指定job配置文件（job.properties）路径 -oozie <arg> 指定oozie server地址 -run 运行job -start <arg>

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > Oozie应用开发常见问题 > 常用OozieAPI接口介绍
ClickHouse集群业务规划 - MapReduce服务 MRS

ClickHouse集群业务规划集群规模建议单集群不超过256节点规模。集群负载对于不同业务负载的业务，需要分开集群部署，便于不同负载的业务进行资源隔离。集群并发由于ClickHouse单个SQL会最大化使用每个主机上的CPU/内存/IO资源，对于复杂SQL查询（复杂

 帮助中心 > MapReduce服务 MRS > 最佳实践 > ClickHouse数据库设计规范 > ClickHouse集群规划
查询作业列表信息 - MapReduce服务 MRS

查询作业列表信息功能介绍在MRS指定集群中查询作业列表信息。接口约束无调用方法请参见如何调用API。 URI GET /v2/{project_id}/clusters/{cluster_id}/job-executions 表1 路径参数参数是否必选参数类型描述

 帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 作业管理接口
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

Java样例代码功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例下面代码片段仅为演示，具体代码参见：com.huawei.bigdata.spark.examples.SparkHivetoHbase

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 从Hive读取数据再写入HBase
配置Spark Core广播变量 - MapReduce服务 MRS

配置Spark Core广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Spark从Hive读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Java）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例下面代码片段仅为演示，具体代码参见：com.huawei.bigdata

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
调整HDFS SHDFShell客户端日志级别 - MapReduce服务 MRS

export HADOOP_ROOT_LOGGER=ERROR,console，调整为ERROR。永久调整在HDFS客户端环境变量配置文件“/opt/client/HDFS/component_env”（其中“/opt/client”需要改为实际客户端路径）增加“export

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
在本地Windows环境中调测HetuEngine应用 - MapReduce服务 MRS

ClientCnxnSocketNetty -Dzookeeper.client.secure=true 在“JDBCExampleZK.java”文件下单击右键，在弹出菜单单击“Run 'JDBCExampleZK.main()' ”。图2 运行程序在IDEA的console中可以看到输出结果。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式） > 调测HetuEngine应用
由于Timeout waiting for task异常导致Shuffle FetchFailed - MapReduce服务 MRS

因此，当数据量达到10T级别以上的Spark任务，建议用户关闭ShuffleService功能，即在“Spark-defaults.conf”配置文件中将配置项“spark.shuffle.service.enabled”配置为“false”。父主题： Spark Core

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
ALM-16007 Hive GC 时间超出阈值 - MapReduce服务 MRS

ALM-16007 Hive GC 时间超出阈值告警解释系统每60秒周期性检测Hive服务的GC时间，当检测到Hive服务的GC时间超出阈值(连续3次检测超过12秒)时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > Hive”修改阈值。当Hive

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置Spark Core广播变量 - MapReduce服务 MRS

配置Spark Core广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
从ogg同步数据到Hudi时，ogg Source配置的Task值与任务实际运行的Task数量不一致 - MapReduce服务 MRS

从ogg同步数据到Hudi时，ogg Source配置的Task值与任务实际运行的Task数量不一致现象描述执行从ogg同步数据到Hudi的CDL任务时，源端（ThirdKafka）中指定的“tasks.max”值与任务实际运行的Task数量不一致。例如，在CDL WebU

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > CDL故障排除
插入ClickHouse数据 - MapReduce服务 MRS

插入ClickHouse数据本章节介绍插入ClickHouse数据样例代码。以下代码片段在com.huawei.clickhouse.examples包的“Demo”类中。创建ClickHouse表创建的表具有三个字段，分别是String、UInt8和Date类型。 String

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（普通模式） > 开发ClickHouse应用
插入ClickHouse数据 - MapReduce服务 MRS

插入ClickHouse数据本章节介绍插入ClickHouse数据样例代码。以下代码片段在com.huawei.clickhouse.examples包的“Demo”类中。创建ClickHouse表创建的表具有三个字段，分别是String、UInt8和Date类型。 String

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（安全模式） > 开发ClickHouse应用
如何修改FlumeClient的日志为标准输出日志？ - MapReduce服务 MRS

force命令，停止FlumeClient。执行vi ../conf/log4j.properties命令，打开log4j.properties文件，修改“flume.root.logger”的取值为“${flume.log.level},console”。执行./flume-manage

帮助中心 > MapReduce服务 MRS > 常见问题 > 组件配置类

总条数： 3647

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark执行Hudi样例程序（Scala） - MapReduce服务 MRS

ClickHouse客户端执行SQL查询时报内存不足如何处理？ - MapReduce服务 MRS

Spark SQL企业级能力增强 - MapReduce服务 MRS

Storm-Kafka开发指引 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

Oozie Shell接口介绍 - MapReduce服务 MRS

ClickHouse集群业务规划 - MapReduce服务 MRS

查询作业列表信息 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

调整HDFS SHDFShell客户端日志级别 - MapReduce服务 MRS

在本地Windows环境中调测HetuEngine应用 - MapReduce服务 MRS

由于Timeout waiting for task异常导致Shuffle FetchFailed - MapReduce服务 MRS

ALM-16007 Hive GC 时间超出阈值 - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

从ogg同步数据到Hudi时，ogg Source配置的Task值与任务实际运行的Task数量不一致 - MapReduce服务 MRS

插入ClickHouse数据 - MapReduce服务 MRS

插入ClickHouse数据 - MapReduce服务 MRS

如何修改FlumeClient的日志为标准输出日志？ - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线