搜索_华为云

HDFS文件系统目录简介 - MapReduce服务 MRS

MR分布式缓存功能无法使用 /user/hive 固定目录 Hive相关数据存储的默认路径，包含依赖的spark lib包和用户默认表数据存储位置等否用户数据丢失 /user/omm-bulkload 临时目录 HBase批量导入工具临时目录否 HBase批量导入任务失败 /user/hbase

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
MapReduce应用开发简介 - MapReduce服务 MRS

rmat，OutputFormat) MapReduce框架根据用户指定的InputFormat切割数据集，读取数据，并提供给map任务多条键值对进行处理，决定并行启动的map任务数目。MapReduce框架根据用户指定的OutputFormat，把生成的键值对输出为特定格式的数据。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式）
Spark SQL在不同DB都可以显示临时表 - MapReduce服务 MRS

查找当前DB的Hive临时表，最后查找当前DB的Hive持久化表。图1 Spark表管理层次当Session退出时，用户操作相关的临时表将自动删除。建议用户不要手动删除临时表。删除临时表时，其优先级与查询相同，从高到低为Spark临时表、Hive临时表、Hive持久化表。如

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
如何查看System.out.println打印的调试信息或将调试信息输出至指定文件 - MapReduce服务 MRS

sh，提交任务。自定义日志若指定了路径<file>/path/test.log</file>，需确保任务运行所使用的用户（flink-conf.yaml配置用户）有权限对该目录进行读写操作。父主题： Flink应用开发常见问题

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > Flink应用开发常见问题
如何查看System.out.println打印的调试信息或将调试信息输出至指定文件 - MapReduce服务 MRS

sh，提交任务。自定义日志若指定了路径<file>/path/test.log</file>，需确保任务运行所使用的用户（flink-conf.yaml配置用户）有权限对该目录进行读写操作。父主题： Flink应用开发常见问题

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > Flink应用开发常见问题
Hive与其他组件的关系 - MapReduce服务 MRS

HDFS分布式并行计算框架。Hive进行数据分析时，会将用户提交的HQL语句解析成相应的MapReduce任务并提交MapReduce执行。 Hive与Tez的关系 Tez是Apache的开源项目，它是一个支持有向无环图的分布式计算框架，Hive使用Tez引擎进行数据分析时，会将用户提交的HQL语句解析成相应的Tez任务并提交Tez执行。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
准备本地应用开发环境 - MapReduce服务 MRS

路径下的示例工程。准备一个应用程序运行测试的Linux环境。准备运行调测环境在弹性云服务器管理控制台，申请一个新的弹性云服务器，用于用户应用程序开发、运行、调测。弹性云服务器的安全组需要和MRS集群Master节点的安全组相同。弹性云服务器的VPC需要与MRS集群在同一个VPC中。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 准备Hive应用开发环境
16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

shuffle操作时SASL认证的超时时间。单位：秒。 120s spark.shuffle.io.connectionTimeout shuffle操作时连接远程节点的超时时间。单位：秒。 120s spark.network.timeout 所有涉及网络连接操作的超时时间。单位：秒。 360s 回答

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

shuffle操作时SASL认证的超时时间。单位：秒。 120s spark.shuffle.io.connectionTimeout shuffle操作时连接远程节点的超时时间。单位：秒。 120s spark.network.timeout 所有涉及网络连接操作的超时时间。单位：秒。 360s 回答

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
如何查看System.out.println打印的调试信息或将调试信息输出至指定文件 - MapReduce服务 MRS

sh，提交任务。自定义日志若指定了路径<file>/path/test.log</file>，需确保任务运行所使用的用户（flink-conf.yaml配置用户）有权限对该目录进行读写操作。父主题： Flink应用开发常见问题

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > Flink应用开发常见问题
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

该特性可以通过下面的配置项开启： spark.sql.statistics.histogram.enabled：指定是否开启直方图功能，默认为false。配置参数登录FusionInsight Manager系统，选择“集群 > 待操作集群的名称 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

约束与限制搬迁数据量较大时，对网络通信要求较高，执行搬迁任务时，可能会影响其他业务，建议在业务空闲期进行数据迁移任务。迁移Hive数据登录CDM管理控制台。创建CDM集群，该CDM集群的安全组、虚拟私有云、子网需要和迁移目的端集群保持一致，保证CDM集群和MRS集群之间网络互通。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

该特性可以通过下面的配置项开启： spark.sql.statistics.histogram.enabled：指定是否开启直方图功能，默认为false。配置参数登录FusionInsight Manager系统，选择“集群 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
如何查看System.out.println打印的调试信息或将调试信息输出至指定文件 - MapReduce服务 MRS

sh，提交任务。自定义日志若指定了路径<file>/path/test.log</file>，需确保任务运行所使用的用户（flink-conf.yaml配置用户）有权限对该目录进行读写操作。父主题： Flink应用开发常见问题

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > Flink应用开发常见问题
Kafka Java API介绍 - MapReduce服务 MRS

生产者通过此参数值，创建与Broker之间的连接。 sasl.kerberos.service.name 服务名。 Kafka集群运行，所使用的Kerberos用户名（需配置为kafka）。 key.serializer 消息Key值序列化类。指定消息Key值序列化方式。 value.serializer

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式） > Kafka应用开发常见问题 > Kafka常用API介绍
Storm与其他组件的关系 - MapReduce服务 MRS

API：提供基于窗口的API。资源调度器：新增基于资源的调度器插件，可以在拓扑定义时指定可使用的最大资源，并且通过配置的方式指定用户的资源配额，从而管理该用户名下的拓扑资源。 State Management：提供带检查点机制的Bolt接口，当事件失败时，Storm会自动管理bolt的状态并且执行恢复。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Storm
配置Yarn大作业扫描 - MapReduce服务 MRS

hetu.job.hdfs.monitor.dir 监控HetuEngine作业的大目录监控路径，不允许监控根目录。如果需要监控的目录包含用户目录等可变目录使用/*/代替。 hdfs://hacluster/hetuserverhistory/*/coordinator/ hetu

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn运维管理
Kafka Java API介绍 - MapReduce服务 MRS

生产者通过此参数值，创建与Broker之间的连接。 sasl.kerberos.service.name 服务名。 Kafka集群运行，所使用的Kerberos用户名（需配置为kafka）。 key.serializer 消息Key值序列化类。指定消息Key值序列化方式。 value.serializer

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式） > Kafka应用开发常见问题 > Kafka常用API介绍
ClickHouse数据入库工具 - MapReduce服务 MRS

工。数据入库建议使用CDL（增量实时同步）和Loader（批量同步）工具进行数据同步，也可选择HDFS外表（CK集群只支持X86平台）用户自己写调度程序进行数据导入。父主题： ClickHouse数据库开发

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库开发
CREATE DATABASE - MapReduce服务 MRS
CREATE DATABASE - MapReduce服务 MRS

EXISTS] db_name [PROPERTIES ("key"="value", ...)]; 使用示例使用具有Doris管理权限的用户通过MySQL客户端连接到Doris。执行以下命令创建数据库example_db： create database if not exists

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见SQL语法说明

总条数： 5611

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HDFS文件系统目录简介 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

Spark SQL在不同DB都可以显示临时表 - MapReduce服务 MRS

如何查看System.out.println打印的调试信息或将调试信息输出至指定文件 - MapReduce服务 MRS

如何查看System.out.println打印的调试信息或将调试信息输出至指定文件 - MapReduce服务 MRS

Hive与其他组件的关系 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

如何查看System.out.println打印的调试信息或将调试信息输出至指定文件 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

如何查看System.out.println打印的调试信息或将调试信息输出至指定文件 - MapReduce服务 MRS

Kafka Java API介绍 - MapReduce服务 MRS

Storm与其他组件的关系 - MapReduce服务 MRS

配置Yarn大作业扫描 - MapReduce服务 MRS

Kafka Java API介绍 - MapReduce服务 MRS

ClickHouse数据入库工具 - MapReduce服务 MRS

CREATE DATABASE - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线