搜索_华为云

批量写入Hudi表 - MapReduce服务 MRS

对于CDC之类几乎肯定包括更新的数据源，建议使用该操作。由于INSERT时不会对主键进行排序，所以初始化数据集不建议使用INSERT。在确定数据都为新数据时建议使用INSERT，当存在更新数据时建议使用UPSERT，当初始化数据集时建议使用BULK_INSERT。批量写入Hudi表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
Hudi性能调优 - MapReduce服务 MRS
Hudi性能调优 - MapReduce服务 MRS

个container。入湖程序的并行度p设置：建议p = (dataSize)/128M，程序分配core的数量保持和p一致即可。内存设置建议内存大小和core的比例大于1.5:1 即一个core配1.5G内存，堆外内存设置建议内存大小和core的比例大于0.5:1。 cow表：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
Hudi性能调优 - MapReduce服务 MRS
Hudi性能调优 - MapReduce服务 MRS

container。入湖程序的并行度p设置：建议 p = （dataSize）/128M, 程序分配core的数量保持和p一致即可。内存设置建议内存大小和core的比例大于1.5:1 即一个core配1.5G内存，堆外内存设置建议内存大小和core的比例大于0.5:1。 cow表：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi
Spark读写Hudi资源配置建议 - MapReduce服务 MRS

针对bucket表的写入资源配置，建议给的CPU核心数量不小于桶数目（分区表每次可能写入多个分区，理想情况下建议给的CPU核心数量=写入分区*分桶数；实际配置的core小于这个值，写入性能线性下降）。示例：当前表bucket数为3，同时写入分区数为2，建议入库Spark任务配置的core数量大于等于3*2。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
配置HDFS单目录文件数量 - MapReduce服务 MRS

配置HDFS单目录文件数量操作场景通常一个集群上部署了多个服务，且大部分服务的存储都依赖于HDFS文件系统。当集群运行时，不同组件（例如Spark、Yarn）或客户端可能会向同一个HDFS目录不断写入文件。但HDFS系统支持的单目录文件数目是有上限的，因此用户需要提前做好规划

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
配置HDFS单目录文件数量 - MapReduce服务 MRS

配置HDFS单目录文件数量操作场景通常一个集群上部署了多个服务，且大部分服务的存储都依赖于HDFS文件系统。当集群运行时，不同组件（例如Spark、Yarn）或客户端可能会向同一个HDFS目录不断写入文件。但HDFS系统支持的单目录文件数目是有上限的，因此用户需要提前做好规划

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

没有聚合函数列的表不应该被创建为AGGREGATE表。创建主键表时需保持主键的列唯一，不建议将所有列都设置为主键列，且主键表需设置value列。主键表不建议用于数据去重场景。 Doris建表建议单表物化视图不能超过6个，物化视图不建议嵌套，不建议数据写入时通过物化视图进行重型聚合和Join计算等ETL任务。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
概述 - MapReduce服务 MRS
概述 - MapReduce服务 MRS

-connector来说，Map任务分区更均匀，并且不依赖区分列是否有创建索引。 mysql-fastpath-connector：MySQL数据库专用连接器，使用MySQL的mysqldump和mysqlimport工具进行数据的导入导出，相对generic-jdbc-connector来说，导入导出速度更快。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
CarbonData调优思路 - MapReduce服务 MRS

ck级索引，这有助于减少需要被扫描的查询block的数量。设置较大的block容量，可提高I/O效率，但是会降低全局索引效率；设置较小的block容量，意味着更多的block数量，会降低I/O效率，但是会提高全局索引效率，同时，对于索引查询会要求更多的内存。扫描线程数量：扫描仪

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
CarbonData调优思路 - MapReduce服务 MRS

ck级索引，这有助于减少需要被扫描的查询block的数量。设置较大的block容量，可提高I/O效率，但是会降低全局索引效率；设置较小的block容量，意味着更多的block数量，会降低I/O效率，但是会提高全局索引效率，同时，对于索引查询会要求更多的内存。扫描线程数量：扫描仪

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

column_num要和数据文件中的列的数量对应。 family的指定要和表的列族名称对应。仅当批量导入数据时创建二级索引才需配置以下参数，且索引类型的首字母需要大写，例如type="String"；以下片段中length="30"表示索引列“H_ID”的列值不能超过30个字符：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
概述 - MapReduce服务 MRS
概述 - MapReduce服务 MRS

-connector来说，Map任务分区更均匀，并且不依赖分区列是否有创建索引。 mysql-fastpath-connector：MYSQL数据库专用连接器，使用MYSQL的mysqldump和mysqlimport工具进行数据的导入导出，相对generic-jdbc-connector来说，导入导出速度更快。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

column_num要和数据文件中的列的数量对应。 family的指定要和表的列族名称对应。仅当批量导入数据时创建二级索引才需配置以下参数，且索引类型的首字母需要大写，例如type="String"；以下片段中length="30"表示索引列“H_ID”的列值不能超过30个字符：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
Spark并发写Hudi建议 - MapReduce服务 MRS

Spark并发写Hudi建议涉及到并发场景，推荐采用分区间并发写的方式：即不同的写入任务写不同的分区分区并发参数控制： SQL方式： set hoodie.support.partition.lock=true; DataSource Api方式： df.write .format("hudi")

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
ALM-14009 故障DataNode数量超过阈值（2.x及以前版本） - MapReduce服务 MRS

故障DataNode数量超过阈值（2.x及以前版本）告警解释系统每30秒周期性检测HDFS集群处于故障状态的DataNode数量，并把实际的故障状态的DataNode数量和阈值相比较。故障状态的DataNode数量指标默认提供一个阈值范围。当HDFS集群故障状态的DataNode数量超出阈值范围时，产生该告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
管理MRS集群数据连接 - MapReduce服务 MRS

”。在数据连接列表的单击待查看的数据连接名称，在弹出的页面查看该数据连接的详细信息。例如查看RDS服务MySQL数据库数据连接信息如下：图1 查看RDS服务MySQL数据库数据连接信息删除数据连接登录MRS管理控制台，在导航栏选择“数据连接”。在数据连接列表的操作列，单击待删除数据连接所在行的“删除

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
Flink应用性能调优建议 - MapReduce服务 MRS

作会导致无法并行，例如WindowAll。 keyBy尽量不要使用String。设置并行度并行度控制任务的数量，影响操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到最优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
Spark输出 - MapReduce服务 MRS
Spark输出 - MapReduce服务 MRS

将字段值输出到SparkSQL表中。如果指定了一个或多个列为分区列，则在作业配置第四步“输出设置”页面上，会显示“分割程序”属性，该属性表示使用多少个处理器去对分区数据进行处理。如果没有指定任何列为分区列，则表示不需要对输入数据进行分区处理，“分割程序”属性默认隐藏。样例通过“CSV文件输入”算子，生成两个字段A和B。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输出类算子
Hudi常见配置参数 - MapReduce服务 MRS

默认值 hoodie.index.class 用户自定义索引的全路径名，索引类必须为HoodieIndex的子类，当指定该配置时，其会优先于hoodie.index.type配置。 "" hoodie.index.type 使用的索引类型，默认为布隆过滤器。可能的选项是[BLOOM |

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
Sqlline接口介绍 - MapReduce服务 MRS

Phoenix的sqlline接口与开源社区保持一致。详情请参见http://phoenix.apache.org/。此版本不包含开源社区中Phoenix二级索引特性。父主题： HBase对外接口介绍

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > HBase应用开发常见问题 > HBase对外接口介绍

总条数： 2146

上一页
1
...
7
8
9
...
108
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

批量写入Hudi表 - MapReduce服务 MRS

Hudi性能调优 - MapReduce服务 MRS

Hudi性能调优 - MapReduce服务 MRS

Spark读写Hudi资源配置建议 - MapReduce服务 MRS

配置HDFS单目录文件数量 - MapReduce服务 MRS

配置HDFS单目录文件数量 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

概述 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

概述 - MapReduce服务 MRS

使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

Spark并发写Hudi建议 - MapReduce服务 MRS

ALM-14009 故障DataNode数量超过阈值（2.x及以前版本） - MapReduce服务 MRS

管理MRS集群数据连接 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

Spark输出 - MapReduce服务 MRS

Hudi常见配置参数 - MapReduce服务 MRS

Sqlline接口介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线