搜索_华为云

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据操作场景 distcp是一种在集群间或集群内部拷贝大量数据的工具。它利用MapReduce任务实现大量数据的分布式拷贝。前提条件已安装Yarn客户端或者包括Yarn的客户端。例如安装目录为“/opt/client”。各组件业务用户

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
HDFS文件系统目录简介 - MapReduce服务 MRS

lib包和用户默认表数据存储位置等否用户数据丢失 /user/omm-bulkload 临时目录 HBase批量导入工具临时目录否 HBase批量导入任务失败 /user/hbase 临时目录 HBase批量导入工具临时目录否 HBase批量导入任务失败 /sparkJobHistory 固定目录 Spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
使用Loader - MapReduce服务 MRS
使用Loader - MapReduce服务 MRS

Loader作业源连接配置说明 Loader作业目的连接配置说明管理Loader作业准备MySQL数据库连接的驱动数据导入数据导出作业管理算子帮助客户端工具说明 Loader日志介绍样例：通过Loader将数据从OBS导入HDFS Loader常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
离线数据加载：通过Spark视图读取Hive外表数据并写入Doris - MapReduce服务 MRS

离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工具时，可以直接使用外表加载、BrokerLoad的方式。本地文件加载则使用Doris自带的StreamLoad工具。图1 离线数据加载操作流程步骤1：创建MRS Hive集群并配置

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
离线数据加载：通过Doris Catalog读取Hive外表数据并写入Doris - MapReduce服务 MRS

离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工具时，可以直接使用外表加载、BrokerLoad的方式。本地文件加载则使用Doris自带的StreamLoad工具。图1 离线数据加载操作流程步骤1：创建MRS Hive集群并配置

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
实时OLAP场景介绍 - MapReduce服务 MRS

reamLoad工具进行本地文件加载。离线数据加载离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工具时，可以直接使用外表加载、BrokerLoad的方式。本地文件加载则使用Doris自带的StreamLoad工具。图2 离线数据加载

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris - MapReduce服务 MRS

离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工具时，可以直接使用外表加载、BrokerLoad的方式。本地文件加载则使用Doris自带的StreamLoad工具。图1 离线数据加载操作流程步骤1：创建MRS Doris集群并配置

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工具时，可以直接使用外表加载、BrokerLoad的方式。本地文件加载则使用Doris自带的StreamLoad工具。图1 离线数据加载操作流程步骤1：创建RDS for MySQL实例、创建数据表

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
如何处理自动加载的依赖包 - MapReduce服务 MRS

在使用IDEA导入工程前，如果IDEA工具中已经进行过Maven配置时，会导致工具自动加载Maven配置中的依赖包。当自动加载的依赖包与应用程序不配套时，导致工程Build失败。如何处理自动加载的依赖包？回答建议在导入工程后，手动删除自动加载的依赖。步骤如下。在IDEA工具中，选择“File >

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题
如何处理自动加载的依赖包 - MapReduce服务 MRS

在使用IDEA导入工程前，如果IDEA工具中已经进行过Maven配置时，会导致工具自动加载Maven配置中的依赖包。当自动加载的依赖包与应用程序不配套时，导致工程Build失败。如何处理自动加载的依赖包？回答建议在导入工程后，手动删除自动加载的依赖。步骤如下：在IDEA工具中，选择“File >

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
如何处理自动加载的依赖包 - MapReduce服务 MRS

在使用IDEA导入工程前，如果IDEA工具中已经进行过Maven配置时，会导致工具自动加载Maven配置中的依赖包。当自动加载的依赖包与应用程序不配套时，导致工程Build失败。如何处理自动加载的依赖包？回答建议在导入工程后，手动删除自动加载的依赖。步骤如下：在IDEA工具中，选择“File >

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
如何处理自动加载的依赖包 - MapReduce服务 MRS

在使用IDEA导入工程前，如果IDEA工具中已经进行过Maven配置时，会导致工具自动加载Maven配置中的依赖包。当自动加载的依赖包与应用程序不配套时，导致工程Build失败。如何处理自动加载的依赖包？回答建议在导入工程后，手动删除自动加载的依赖。步骤如下：在IDEA工具中，选择“File >

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
如何处理自动加载的依赖包 - MapReduce服务 MRS

在使用IDEA导入工程前，如果IDEA工具中已经进行过Maven配置时，会导致工具自动加载Maven配置中的依赖包。当自动加载的依赖包与应用程序不配套时，导致工程Build失败。如何处理自动加载的依赖包？回答建议在导入工程后，手动删除自动加载的依赖。步骤如下：在IDEA工具中，选择“File >

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
离线数据加载：通过CDM将Hive外表数据迁移到Doris - MapReduce服务 MRS

离线数据，端到端时延无要求。在存在DataArts Studio工具的场景下，数据加载使用CDM进行将离线的Hive外表数据迁移到MRS Doris。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工具时，可以直接使用外表加载、BrokerLo

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
配置Hive SQL防御规则 - MapReduce服务 MRS

动态规则dynamic_0001（SQL语句扫描的文件数超过阈值），当Spark与Tez引擎达到提示阈值时拦截日志会在Yarn任务日志中打印，不支持在Beeline客户端输出。熔断规则存在统计误差，例如规则running_0004，扫描数据量阈值配置10GB，但是因为判断周期和任

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群SQL防御规则
添加MRS SQL防御规则 - MapReduce服务 MRS

table testtb1 on cluster default_cluster; dynamic_0001 扫描文件数超限制。 Hive Spark HetuEngine 计划/已经扫描的文件数量阈值。建议配置值：100000 SELECT ss_ticket_number FROM store_sales

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群SQL防御规则
准备本地应用开发环境 - MapReduce服务 MRS

开发环境和运行环境：Linux系统。安装Python 用于开发Hive应用程序的工具，版本要求不低于2.6.6，最高不超过2.7.13。安装setuptools Python开发环境的基本配置，版本要求5.0以上。 Python开发工具的详细安装配置可参见配置Hive Python样例工程。准备Python3开发环境

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > 准备Hive应用开发环境
配置HDFS冷热数据迁移 - MapReduce服务 MRS

支持使用"-fs"选项，用于指定客户端默认的文件系统地址。审计日志冷热数据迁移工具支持以下操作的审计日志。工具启动状态行为类型及参数详细信息和状态工具完成状态对于启用审计日志工具，在“<HADOOP_CONF_DIR>/log4j.property”文件中添加以下属性。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本） > 使用Hue WebUI典型场景
准备本地应用开发环境 - MapReduce服务 MRS

开发环境和运行环境：Linux系统。安装Python 用于开发Hive应用程序的工具，版本要求不低于2.6.6，最高不超过2.7.13。安装setuptools Python开发环境的基本配置，要求5.0之后版本。 Python开发工具的详细安装配置可参见配置Hive Python样例工程。准备Python3开发环境

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 准备Hive应用开发环境
配置HDFS冷热数据迁移 - MapReduce服务 MRS

支持使用"-fs"选项，用于指定客户端默认的文件系统地址。审计日志冷热数据迁移工具支持以下操作的审计日志。工具启动状态行为类型及参数详细信息和状态工具完成状态对于启用审计日志工具，在“<HADOOP_CONF_DIR>/log4j.property”文件中添加以下属性。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue

总条数： 721

上一页
1
...
5
6
7
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

HDFS文件系统目录简介 - MapReduce服务 MRS

使用Loader - MapReduce服务 MRS

离线数据加载：通过Spark视图读取Hive外表数据并写入Doris - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取Hive外表数据并写入Doris - MapReduce服务 MRS

实时OLAP场景介绍 - MapReduce服务 MRS

离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

如何处理自动加载的依赖包 - MapReduce服务 MRS

如何处理自动加载的依赖包 - MapReduce服务 MRS

如何处理自动加载的依赖包 - MapReduce服务 MRS

如何处理自动加载的依赖包 - MapReduce服务 MRS

如何处理自动加载的依赖包 - MapReduce服务 MRS

离线数据加载：通过CDM将Hive外表数据迁移到Doris - MapReduce服务 MRS

配置Hive SQL防御规则 - MapReduce服务 MRS

添加MRS SQL防御规则 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

配置HDFS冷热数据迁移 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

配置HDFS冷热数据迁移 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线