搜索_华为云

foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
Doris应用开发简介 - MapReduce服务 MRS

入过的行中的Value。 MAX：保留最大值。 MIN：保留最小值。 Unique模型在某些多维分析场景下，用户更关注的是如何保证Key的唯一性，即如何获得Primary Key唯一性约束。因此，引入了Unique数据模型。读时合并 Unique模型的读时合并实现完全可以用A

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Doris开发指南（普通模式）
操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile导入HBase表的操作

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile导入HBase表的操作

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
Yarn节点配置调优 - MapReduce服务 MRS

Yarn节点配置调优操作场景合理配置大数据集群的调度器后，还可通过调节每个节点的可用内存、CPU资源及本地磁盘的配置进行性能调优。具体包括以下配置项：可用内存 CPU虚拟核数物理CPU使用百分比内存和CPU资源的协调本地磁盘操作步骤如果您需要对参数配置进行调整，具体操作请参考修改集群服务配置参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn性能调优
流式写入Hudi表 - MapReduce服务 MRS

--transformer-class com.huawei.bigdata.hudi.examples.TransformerExample // 指定如何处理数据源拉取来的数据，可根据自身业务需求做定制 --enable-hive-sync // 开启hive同步，同步hudi表到hive --continuous

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
使用客户端提交Storm拓扑 - MapReduce服务 MRS

如果需要拓扑支持采样消息，则还需要增加参数“topology.debug”和“topology.eventlogger.executors”。拓扑如何处理数据是拓扑自身行为。样例拓扑随机生成字符并分隔字符串，需要查看处理情况时，请启用采样功能并参见查看Storm拓扑日志。 MRS 3.x

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm
FlinkSQL OVER窗口支持超期退窗 - MapReduce服务 MRS

UI的作业开发界面添加自定义参数“over.window.interval”，且值配置为大于或等于“0”时开启窗口支持数据超期功能，创建作业可参考如何创建FlinkServer作业。该设置会对作业中的所有over窗口生效，建议对单over窗口的作业使用此功能。 SQL示例： CREATE

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
配置FlinkServer作业中添加第三方依赖jar - MapReduce服务 MRS

如上传依赖名称为“kafka”，自定义connector jar包名称为“flink-connector-kafka-customization.jar”。参考如何创建FlinkServer作业新建SQL作业，该SQL中的“connector”需填写为对应的依赖名称，如'connector' = 'kafka'。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 管理FlinkServer作业
FlinkSQL算子并行度 - MapReduce服务 MRS

resource.default-parallelism”值，即可修改算子的并行度。示例开发FlinkServer SQL作业。可参考如何创建FlinkServer作业在FlinkServer的SQL开发界面，开发如下SQL并单击“语义校验”： set parallelism

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
重启MRS集群组件 - MapReduce服务 MRS

单击“服务管理”。单击待操作的组件名称，进入详情页面。在服务详情页面，单击“更多”，根据实际需要选择“重启服务”或“滚动重启服务”。验证操作用户密码（通过Manager操作时需要）并确认操作影响后，单击“确定”进行重启。选择滚动重启时可以根据实际需要参考表1配置相关参数。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群组件
Flink任务开发规则 - MapReduce服务 MRS

[2,8] //若是无法识别是对ID=2的数据进行了更新。聚合结果：[1,22],[2,8] //识别为更新操作可以得到正确结果。对于如何识别是更新数据有三种方式：通过状态后端解决通过状态后端存储所有原始数据，新来的数据根据状态来判断是否是更新操作，进而通过Flink聚合回撤机制实现聚合结果数据的更新。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink任务开发规范
Yarn节点配置调优 - MapReduce服务 MRS

Yarn节点配置调优操作场景合理配置大数据集群的调度器后，还可通过调节每个节点的可用内存、CPU资源及本地磁盘的配置进行性能调优。具体包括以下配置项：可用内存 CPU虚拟核数物理CPU使用百分比内存和CPU资源的协调本地磁盘操作步骤若您需要对参数配置进行调整，具体操作请参考修改集群服务配置参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
mapPartition接口使用 - MapReduce服务 MRS

mapPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用mapPartition接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkPut接口使用 - MapReduce服务 MRS

BulkPut接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将构建的RDD写入HBase中。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的Hase表： create

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
准备连接MapReduce集群配置文件 - MapReduce服务 MRS

准备连接MapReduce集群配置文件如果需要使用访问多组件样例程序，请确保集群已安装Hive、HBase服务。准备集群认证用户信息对于开启Kerberos认证的MRS集群，需提前准备具有相关组件操作权限的用户，并下载认证凭据文件用于程序认证。以下MapReduce权限配

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式） > 准备MapReduce应用开发环境
BulkPut接口使用 - MapReduce服务 MRS

BulkPut接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将构建的RDD写入HBase中。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的Hase表： create

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序

总条数： 1625

上一页
1
...
77
78
79
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

foreachPartition接口使用 - MapReduce服务 MRS

Doris应用开发简介 - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

流式写入Hudi表 - MapReduce服务 MRS

使用客户端提交Storm拓扑 - MapReduce服务 MRS

FlinkSQL OVER窗口支持超期退窗 - MapReduce服务 MRS

配置FlinkServer作业中添加第三方依赖jar - MapReduce服务 MRS

FlinkSQL算子并行度 - MapReduce服务 MRS

重启MRS集群组件 - MapReduce服务 MRS

Flink任务开发规则 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

BulkPut接口使用 - MapReduce服务 MRS

准备连接MapReduce集群配置文件 - MapReduce服务 MRS

BulkPut接口使用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线