搜索_华为云

Spark Core样例程序（Python） - MapReduce服务 MRS

appName("CollectFemaleInfo") \ .getOrCreate() """ 以下程序主要实现以下几步功能： 1.读取数据。其是传入参数argv[1]指定数据路径 - text 2.筛选女性网民上网时间数据信息 - filter 3.汇总每个女性上网时间

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Core样例程序
Spark Streaming性能调优 - MapReduce服务 MRS

现数据丢失。 ReliableKafkaReceiver：通过ZooKeeper记录接收数据位移。 DirectKafka：直接通过RDD读取Kafka每个Partition中的数据，数据高可靠。从实现上来看，DirectKafka的性能更好，实际测试上来看，DirectKaf

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
运行SparkSql作业 - MapReduce服务 MRS

因不同版本操作界面可能存在差异，相关视频供参考，具体以实际环境为准。前提条件用户已经将作业所需的程序包和数据文件上传至OBS或HDFS文件系统中。如果作业程序需要读取以及分析OBS文件系统中的数据，需要先配置MRS集群的存算分离，请参考配置MRS集群存算分离。通过管理控制台提交作业登录MRS管理控制台。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
HDFS样例程序开发思路 - MapReduce服务 MRS

t的write方法追加写入数据。调用fSystem的open接口创建FSDataInputStream对象：in，使用in的read方法读取文件。调用fSystem中的delete接口删除文件。调用fSystem中的delete接口删除文件夹。父主题：开发HDFS应用

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 开发HDFS应用
Spark Core样例程序（Python） - MapReduce服务 MRS

appName("CollectFemaleInfo") \ .getOrCreate() """ 以下程序主要实现以下几步功能： 1.读取数据。其是传入参数argv[1]指定数据路径 - text 2.筛选女性网民上网时间数据信息 - filter 3.汇总每个女性上网时间

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Core样例程序
Spark Core样例程序（Python） - MapReduce服务 MRS

appName("CollectFemaleInfo") \ .getOrCreate() """ 以下程序主要实现以下几步功能： 1.读取数据。其是传入参数argv[1]指定数据路径 - text 2.筛选女性网民上网时间数据信息 - filter 3.汇总每个女性上网时间

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Core样例程序
Spark Core样例程序（Python） - MapReduce服务 MRS

appName("CollectFemaleInfo") \ .getOrCreate() """ 以下程序主要实现以下几步功能： 1.读取数据。其是传入参数argv[1]指定数据路径 - text 2.筛选女性网民上网时间数据信息 - filter 3.汇总每个女性上网时间

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Core样例程序
降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

参数说明参数描述默认值 mapreduce.reduce.shuffle.max-host-failures MR任务在reduce过程中读取远端shuffle数据允许失败的次数。当设置次数大于5时，可以降低客户端应用的失败率。该参数适用于MRS 3.x版本。 5 mapreduce

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

单击“保存并运行”，回到作业管理界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在历史记录界面单击“日志”，可查看作业的日志信息。父主题：数据迁移

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
SET/RESET - MapReduce服务 MRS
SET/RESET - MapReduce服务 MRS

carbon.input.segments 指定要查询的段ID。此属性允许您查询指定表的指定段。CarbonScan将仅从指定的段ID读取数据。语法： “carbon.input.segments. <database_name>. <table_name> = < list

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
HDFS样例程序开发思路 - MapReduce服务 MRS

调用fileSystem中的mkdir接口创建目录。调用HdfsWriter的dowrite接口写入信息。调用fileSystem中的open接口读取文件。调用HdfsWriter的doAppend接口追加信息。调用fileSystem中的deleteOnExit接口删除文件。调用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 开发HDFS应用
Python样例代码 - MapReduce服务 MRS

SparkContext(appName = "CollectFemaleInfo")? """ 以下程序主要实现以下几步功能： 1.读取数据。传入参数argv[1]指定数据路径 - textFile 2.筛选女性网民上网时间数据信息 - filter 3.汇总每个女性上网时间

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Core程序
导入并配置Flink SpringBoot样例工程 - MapReduce服务 MRS

Settings”，弹出“Settings”窗口。选择“Build, Execution, Deployment > Compiler > Java Compiler”，在“Project bytecode version”右侧的下拉菜单中，选择“8”。修改“flink-dws-sink-example”的“Target

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 准备Flink应用开发环境
导入并配置Flink SpringBoot样例工程 - MapReduce服务 MRS

Settings”，弹出“Settings”窗口。选择“Build, Execution, Deployment > Compiler > Java Compiler”，在“Project bytecode version”右侧的下拉菜单中，选择“8”。修改“flink-dws-sink-example”的“Target

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 准备Flink应用开发环境
使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

Topic监控图5 Consumer监控 Kafka Eagle对接常见问题问题现象：无法获取Kafka CPU与内存监控信息日志提示。 java.io.IOException cannot be cast to javax.management.remote.JMXConnector

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
MapReduce访问多组件样例代码 - MapReduce服务 MRS

line.indexOf(",")); } // 1. 读取HBase数据 String hbaseData = readHBase(); // 2. 读取Hive数据 String hiveData = readHive(name);

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（普通模式） > 开发MapReduce应用 > MapReduce访问多组件样例程序
SET/RESET - MapReduce服务 MRS
SET/RESET - MapReduce服务 MRS

carbon.input.segments 指定要查询的段ID。此属性允许您查询指定表的指定段。CarbonScan将仅从指定的段ID读取数据。语法： “carbon.input.segments. <database_name>. <table_name> = < list

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
Spark Streaming性能调优 - MapReduce服务 MRS

现数据丢失。 ReliableKafkaReceiver：通过ZooKeeper记录接收数据位移。 DirectKafka：直接通过RDD读取Kafka每个Partition中的数据，数据高可靠。从实现上来看，DirectKafka的性能更优，实际测试上来看，DirectKaf

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
GROUP BY - MapReduce服务 MRS
GROUP BY - MapReduce服务 MRS

组列的将被设置为NUll。具有复杂分组语法（GROUPING SETS、CUBE或ROLLUP）的查询只从基础数据源读取一次，而使用UNION ALL的查询将读取基础数据三次。这就是当数据源不具有确定性时，使用UNION ALL的查询可能会产生不一致的结果的原因。 --创建一个航运表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.files.maxPartitionBytes 在读取文件时，将单个分区打包的最大字节数。单位：byte。 134217728（即128M） spark.files.openCostInBytes

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优

总条数： 2063

上一页
1
...
86
87
88
...
104
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Core样例程序（Python） - MapReduce服务 MRS

Spark Streaming性能调优 - MapReduce服务 MRS

运行SparkSql作业 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

Spark Core样例程序（Python） - MapReduce服务 MRS

Spark Core样例程序（Python） - MapReduce服务 MRS

Spark Core样例程序（Python） - MapReduce服务 MRS

降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

SET/RESET - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

Python样例代码 - MapReduce服务 MRS

导入并配置Flink SpringBoot样例工程 - MapReduce服务 MRS

导入并配置Flink SpringBoot样例工程 - MapReduce服务 MRS

使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

MapReduce访问多组件样例代码 - MapReduce服务 MRS

SET/RESET - MapReduce服务 MRS

Spark Streaming性能调优 - MapReduce服务 MRS

GROUP BY - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线