搜索_华为云

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

ion的locators分配进行重新规划。 2 创建一批新的locators，并重新规划数据存放方式。旧的locators使用的是旧的数据节点，而新创建的locators偏重使用新的数据节点，所以需要根据实际业务对数据的使用需求，重新规划locators的使用。一般的，建议用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式） > 开发HDFS应用
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

ion的locators分配进行重新规划。 2 创建一批新的locators，并重新规划数据存放方式。旧的locators使用的是旧的数据节点，而新创建的locators偏重使用新的数据节点，所以需要根据实际业务对数据的使用需求，重新规划locators的使用。一般的，建议用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
MRS作业类型介绍 - MapReduce服务 MRS

MRS也支持将OBS中的数据导入至HDFS中，使用HDFS中的数据进行计算分析。数据完成处理和分析后，您可以将数据存储在HDFS中，也可以将集群中的数据导出至OBS系统。HDFS和OBS也支持存储压缩格式的数据，目前支持存储bz2、gz压缩格式的数据。目前MRS集群支持在线创建如下几种类型的作业：

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业
准备连接HBase集群配置文件 - MapReduce服务 MRS

选择“系统 > 权限 > 角色 > 添加角色”。填写角色的名称，例如developrole。在“配置资源权限”的表格中选择“待操作集群的名称 > HBase > HBase Scope ”，勾选“global”的“管理”、“创建”、“读”、“写”和“执行”，单击“确定”保存。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 准备HBase应用开发环境
Hudi Clustering操作说明 - MapReduce服务 MRS

置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能够支持快速摄取的同时不影响查询性能，引入了Clustering服务来重写数据以优化Hudi数据湖文件的布局。 Clustering服务

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > 数据管理维护
MRS集群Task节点弹性伸缩概述 - MapReduce服务 MRS

开头。可输入的字符串长度为1～64个字符。说明：同一集群内，不允许配置相同的名称。不同集群之间，可以配置相同的名称。脚本路径 obs://mrs-samples/test.sh 脚本的路径。路径可以是OBS文件系统的路径或虚拟机本地的路径。 OBS文件系统的路径，必须以obs://开头，以

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整 > MRS集群Task节点弹性伸缩
SparkSQL建表参数规范 - MapReduce服务 MRS

preCombineField 预合并键，相同主键的多条数据按该字段进行合并按需必须指定，相同主键的数据会按该字段合并，不能指定多个字段。禁止建表时将hoodie.datasource.hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Me

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
执行CDL同步数据到Hudi任务报错当前用户无权限创建表 - MapReduce服务 MRS

击“确定”。单击“用户”，单击提交该任务的用户所在行的“修改”，在角色中新增1新建的角色，单击“确定”。选择“集群 > 服务 > CDL”，单击“CDLService UI”右侧的超链接进入CDL WebUI界面，选择该作业所在行的“更多 > 停止”，停止CDL任务。任务停止

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > CDL故障排除
ClickHouse容量规划设计 - MapReduce服务 MRS

ClickHouse容量规划设计为了能够更好的发挥ClickHouse分布式查询能力，在集群规划阶段需要合理设计集群数据分布存储。当前ClickHouse能力为单机磁盘容量达到80%后会上报告警信息，磁盘容量达90%后集群会处于只读状态。出现磁盘告警信息后需要考虑是否是容量

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse集群规划
导入并配置Spark样例工程 - MapReduce服务 MRS

针对Java和Scala不同语言的工程，其导入方式相同。使用Python开发的样例工程不需要导入，直接打开Python文件（*.py）即可。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程前提条件确保本地环境的时间与MRS集群的时间差要小于5分钟，若

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
导入并配置Spark样例工程 - MapReduce服务 MRS

针对Java和Scala不同语言的工程，其导入方式相同。使用Python开发的样例工程不需要导入，直接打开Python文件（*.py）即可。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程前提条件确保本地环境的时间与MRS集群的时间差要小于5分钟，若

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
ClickHouse分区设计 - MapReduce服务 MRS

ClickHouse分区设计合理设置分区键，控制分区数在一千以内，分区字段使用整型。分区part数与查询性能关系图1 分区part数与查询性能关系图分区建议建议使用toYYYYMMDD（pt_d）作为分区键，pt_d是date类型。如果业务场景需要做小时分区，使用pt

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
准备MRS应用开发用户 - MapReduce服务 MRS

选择“待操作集群的名称 > Hive > Hive读写权限”，勾选“default”的 “查询”、“插入”、“建表”、“递归”。单击“确定”保存。编辑角色，在“配置资源权限”的表格中选择“待操作集群的名称 > Yarn > 调度队列 > root”，勾选default的“提交”，单击“确定”保存。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MRS应用开发安全认证说明
ClickHouse分布式表设计 - MapReduce服务 MRS

通过“AS”关联分布式表和本地表，保证分布式表的字段定义跟本地表一致。分布式表引擎的参数说明： default_cluster：集群名称。 default：本地表所在库名。 my_table_local：本地表名。 rand()：可选参数，分片键（sharding key），可以是表中一列的原始数据（如did），也可以是函数调用的结果。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
创建Bucket索引表调优 - MapReduce服务 MRS

方法三：数据老化，按照业务逻辑分析大的维度表是否可以通过数据老化清理无效的维度数据从而降低数据规模。数据量非常小的事实表这种可以在预估很长一段时间的数据增长量的前提下使用非分区表预留稍宽裕一些的桶数来提升读写性能。确认表内桶数 Hudi表的桶数设置，关系到表的性能，需要格外引起注意。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
配置Container日志聚合功能 - MapReduce服务 MRS

”参数还需要在Yarn的客户端进行配置，且在ResourceManager、NodeManager和JobHistory节点的配置与在Yarn的客户端的配置必须一致。周期性收集日志功能目前仅支持MapReduce应用，且MapReduce应用必须进行相应的日志文件滚动输出配置，

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

name：为本NettySource的名称，该NettySource必须是唯一的（并发度除外），否则，连接NettySink时会出现冲突，导致无法连接。 topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Job Pipeline样例程序
插入表数据 - MapReduce服务 MRS
插入表数据 - MapReduce服务 MRS

其中： MERGE INTO：目标表。 USING：源表查询语句。 ON：源表和目标表匹配的条件。 WHEN：数据更新条件。 insert into ... select ...;语法中不支持可空字段类型的数据插入到非空字段类型。使用示例向表中插入数据： INSERT

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Iceberg > Iceberg常用SQL语法
CREATE VIRTUAL SCHEMA - MapReduce服务 MRS

] ) 创建一个virtual schema，需要在WITH中提供具体映射的schema信息。 ctlg_dest为在哪个数据源创建virtual schema，参数可选，如果不指定则取当前Session中的catalog，如果当前Session中也未指定catalog则会创建失败。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DDL SQL语法说明
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

name：为本NettySource的名称，该NettySource必须是唯一的（并发度除外），否则，连接NettySink时会出现冲突，导致无法连接。 topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Job Pipeline样例程序

总条数： 4399

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

MRS作业类型介绍 - MapReduce服务 MRS

准备连接HBase集群配置文件 - MapReduce服务 MRS

Hudi Clustering操作说明 - MapReduce服务 MRS

MRS集群Task节点弹性伸缩概述 - MapReduce服务 MRS

SparkSQL建表参数规范 - MapReduce服务 MRS

执行CDL同步数据到Hudi任务报错当前用户无权限创建表 - MapReduce服务 MRS

ClickHouse容量规划设计 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

ClickHouse分区设计 - MapReduce服务 MRS

准备MRS应用开发用户 - MapReduce服务 MRS

ClickHouse分布式表设计 - MapReduce服务 MRS

创建Bucket索引表调优 - MapReduce服务 MRS

配置Container日志聚合功能 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

插入表数据 - MapReduce服务 MRS

CREATE VIRTUAL SCHEMA - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线