搜索_华为云

Spark Scala API接口介绍 - MapReduce服务 MRS

count(): Long 返回DataFrame中的行数。 describe(cols: String*): DataFrame 计算统计信息，包含计数，平均值，标准差，最小值和最大值。 first(): Row 返回第一行。 Head(n:Int): Row 返回前n行。 show(numRows:

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

从MySQL官网下载MySQL jdbc驱动程序“mysql-connector-java-xxx.jar”，具体MySQL jdbc驱动程序选择参见下表。表1 版本信息 jdbc驱动程序版本 MySQL版本 Connector/J 5.1 MySQL 4.1、MySQL 5.0、MySQL 5.1、MySQL

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
准备Spark连接集群配置文件 - MapReduce服务 MRS

检查客户端节点网络连接。在安装客户端过程中，系统会自动配置客户端节点“hosts”文件，建议检查“/etc/hosts”文件内是否包含集群内节点的主机名信息，如未包含，需要手动复制解压目录下的“hosts”文件中的内容到客户端所在节点的hosts文件中，确保本地机器能与集群各主机在网络上互通。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
导入并配置Hive JDBC样例工程 - MapReduce服务 MRS

修改“Module SDK” 单击“Apply”，单击“OK”。配置Maven。参考配置华为开源镜像仓章节描述，增加开源镜像仓地址等配置信息到本地Maven的“setting.xml”配置文件。修改完成后，在IntelliJ IDEA选择“File > Settings > Build

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
创建HDFS权限角色 - MapReduce服务 MRS

HDFS常见目录如下： “flume”：Flume数据存储目录。 “hbase”：HBase数据存储目录。 “mr-history”：MapReduce任务信息存储目录。 “tmp”：临时数据存储目录。 “user”：用户数据存储目录。单击“确定”完成，返回“角色”页面。父主题： HDFS用户权限管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS用户权限管理
Spark Scala API接口介绍 - MapReduce服务 MRS

count(): Long 返回DataFrame中的行数。 describe(cols: String*): DataFrame 计算统计信息，包含计数，平均值，标准差，最小值和最大值。 first(): Row 返回第一行。 Head(n:Int): Row 返回前n行。 show(numRows:

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Java API接口介绍 - MapReduce服务 MRS

count() 返回DataFrame的行数。 DataFrame describe(java.lang.String... cols) 计算统计信息，包含计数，平均值，标准差，最小值和最大值。 Row first() 返回第一行。 Row[] head(int n) 返回前n行。 void

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark scala API接口介绍 - MapReduce服务 MRS

count(): Long 返回DataFrame中的行数。 describe(cols: String*): DataFrame 计算统计信息，包含计数，平均值，标准差，最小值和最大值。 first(): Row 返回第一行。 Head(n:Int): Row 返回前n行。 show(numRows:

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
使用客户端运行Loader作业 - MapReduce服务 MRS

key”后加密工具执行时会重新生成新的随机密钥并保存在“.loader-tools.key”中。命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。 shLoader客户端安装目录/Loader/loader-tools-1.99.3/encrypt_toolpassword

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
Yarn节点配置调优 - MapReduce服务 MRS

u-limit 表示该节点上YARN可使用的物理CPU百分比。默认是90，即不进行CPU控制，YARN可以使用节点全部CPU。该参数只支持查看，可通过调整YARN的RES_CPUSET_PERCENTAGE参数来修改本参数值。注意，目前推荐将该值设为可供YARN集群使用的CPU百分数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
Spark Java API接口介绍 - MapReduce服务 MRS

count() 返回DataFrame的行数。 DataFrame describe(java.lang.String... cols) 计算统计信息，包含计数，平均值，标准差，最小值和最大值。 Row first() 返回第一行。 Row[] head(int n) 返回前n行。 void

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Java API接口介绍 - MapReduce服务 MRS

count() 返回DataFrame的行数。 DataFrame describe(java.lang.String... cols) 计算统计信息，包含计数，平均值，标准差，最小值和最大值。 Row first() 返回第一行。 Row[] head(int n) 返回前n行。 void

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
取消SQL执行任务 - MapReduce服务 MRS

不涉及请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 message String 参数解释：错误信息。约束限制：不涉及取值范围：不涉及默认取值：不涉及 status String 参数解释：取消SQL的执行结果。默认返回SU

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > SQL接口
导入并配置Spark样例工程 - MapReduce服务 MRS

确保本地环境的时间与MRS集群的时间差要小于5分钟，若无法确定，请联系系统管理员。MRS集群的时间可通过FusionInsight Manager页面右下角查看。已准备开发环境及MRS集群相关配置文件，详情请参考准备Spark连接集群配置文件。操作步骤参考获取MRS应用开发样例工程，获取样例

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
导入并配置Spark样例工程 - MapReduce服务 MRS

确保本地环境的时间与MRS集群的时间差要小于5分钟，若无法确定，请联系系统管理员。MRS集群的时间可通过FusionInsight Manager页面右下角查看。已准备开发环境及MRS集群相关配置文件，详情请参考准备Spark连接集群配置文件。操作步骤参考获取MRS应用开发样例工程，获取样例

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
准备本地应用开发环境 - MapReduce服务 MRS

检查客户端节点网络连接。在安装客户端过程中，系统会自动配置客户端节点“hosts”文件，建议检查“/etc/hosts”文件内是否包含集群内节点的主机名信息，如未包含，需要手动复制解压目录下的“hosts”文件中的内容到客户端所在节点的hosts文件中，确保本地机器能与集群各主机在网络上互通。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 准备Flink应用开发环境
Flink作业大小表Join能力增强 - MapReduce服务 MRS

需要处理大量重复数据，影响作业性能。如A表字段（P1，A1，A2）使用如下方式关联B表字段（P1，B1，B2，B3）生成C的场景中，B表信息发生大量更新，但是B中的所需字段没有更新，在该关联中仅用到了B表的B1和B2字段，对于B表，每个记录更新只更新B3字段，B1和B2不更新，因此当B表更新，可以忽略更新后的数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
启用Yarn CGroups功能限制Container CPU使用率 - MapReduce服务 MRS

当前CGroups仅用于限制CPU使用率。本章节适用于MRS 3.x及后续版本集群。配置描述有关如何配置CPU隔离与安全的CGroups功能的详细信息，请参见Hadoop官网： MRS 3.2.0之前版本：http://hadoop.apache.org/docs/r3.1.1/hado

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn
安全集群中使用Python3.x对接Kafka - MapReduce服务 MRS

x的tgz包也可以去Python官网下载。推荐使用Python-3.6.X版本，3.7版本无法使用rdd的take函数。执行如下命令，设置Python3.x的配置信息及编译安装，安装到/opt/Bigdata/python3目录下。 ./configure --prefix=/opt/Bigdata/python3

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

在客户端安装节点下创建文件目录：“/home/data”。将上述文件上传到此“/home/data”目录下。创建Topic。 {zkQuorum}表示ZooKeeper集群信息，格式为IP:port。 $KAFKA_HOME/bin/kafka-topics.sh --create --zookeeper {zkQuorum}/kafka

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序

总条数： 4130

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Scala API接口介绍 - MapReduce服务 MRS

Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

准备Spark连接集群配置文件 - MapReduce服务 MRS

导入并配置Hive JDBC样例工程 - MapReduce服务 MRS

创建HDFS权限角色 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

Spark scala API接口介绍 - MapReduce服务 MRS

使用客户端运行Loader作业 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

取消SQL执行任务 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

Flink作业大小表Join能力增强 - MapReduce服务 MRS

启用Yarn CGroups功能限制Container CPU使用率 - MapReduce服务 MRS

安全集群中使用Python3.x对接Kafka - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线