搜索_华为云

配置Spark Streaming对接Kafka时数据后进先出功能 - MapReduce服务 MRS

动后C段时间的任务启用流控功能。配置描述在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.streaming.kafka.direct.lifo 配置是否开启Kafka后进先出功能。 false

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Streaming企业级能力增强
管理MRS角色实例 - MapReduce服务 MRS

登录MRS管理控制台。选择“现有集群”，选中一个运行中的集群并单击集群名称，进入集群信息页面。在集群详情页，单击“组件管理”。单击服务列表中指定的服务名称。单击“实例”页签。勾选待操作角色实例前的复选框。选择“更多 > 启动实例”、“停止实例”、“重启实例”或“滚动重启实例”等，执行相应操作。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群组件
集群在线扩缩容 - MapReduce服务 MRS

端自动刷新位置信息可能会影响时延。缩容节点可能会影响部分HBase on HDFS数据的第一次访问响应时长，可以重启HBase或者对相关的表执行Disable/Enable操作来避免。 Task节点本身不存储集群数据，属于计算节点，不存在节点数据迁移的问题。父主题：集群管理

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
ZooKeeper开源增强特性 - MapReduce服务 MRS

通过配置此参数定义SSL协议以适用于SSL上下文。 -Dzookeeper.ssl.exclude.cipher.ext 通过配置此参数定义SSL上下文中应排除的密码列表，之间以逗号间隔。以上参数须在“zkCli.sh/zkEnv.sh”文件内设置。 Server端在文件“zoo.cfg”中将SSL端口参

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ZooKeeper
配置AM自动调整分配内存 - MapReduce服务 MRS

”分隔，格式为：baseTaskCount:taskStep:memoryStep,minMemory:maxMemory，在键入时会严格校验格式。表1 配置数值说明数值名称描述设定要求 baseTaskCount 任务总量基数，只有当应用的task总数（map端与reduce端之和）不小于该值时配置才会起作用。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn企业级能力增强
配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

hadoop.hdfs.server.blockmanagement.AvailableSpaceBlockPlacementPolicy”。表1 参数描述参数参数说明 dfs.block.replicator.classname 选择副本放置的DataNode的策略。默认值为“org

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS企业级能力增强
什么是区域和可用区？ - MapReduce服务 MRS

上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。图1表示区域和可用区之间的关系。图1 区域和可用区目前，华为云已在全球多个地域开放云服务，您可以根据需求选择适合自己的区域和可用区。更多信息请参见华为云全球站点。

帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

hadoop.hdfs.server.blockmanagement.AvailableSpaceBlockPlacementPolicy”。表1 参数描述参数参数说明 dfs.block.replicator.classname 选择副本放置的DataNode的策略。默认值为“org

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
使用KafkaStreams统计数据 - MapReduce服务 MRS

final KTable<String, Long> counts = source // 处理接收的记录，根据正则表达式REGEX_STRING进行分割 .flatMapValues(value -> Arrays.asList(value

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式） > 开发Kafka应用
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

conf”配置文件中配置如下参数。“spark.yarn.max.executor.failures”如果不存在，则手动添加该参数项。表1 参数说明参数描述默认值 spark.task.maxFailures task retry次数。 4 spark.yarn.max

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

在客户端的“spark-defaults.conf”配置文件中配置如下参数。“spark.yarn.max.executor.failures”若不存在，则手动添加该参数项。表1 参数说明参数描述默认值 spark.task.maxFailures task retry次数。 4 spark.yarn.max

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
使用KafkaStreams统计数据 - MapReduce服务 MRS

final KTable<String, Long> counts = source // 处理接收的记录，根据正则表达式REGEX_STRING进行分割 .flatMapValues(value -> Arrays.asList(value

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式） > 开发Kafka应用
PyFlink样例程序代码说明 - MapReduce服务 MRS

print("------------------read_write_kafka----------------") read_write_kafka() 表1 使用Python提交普通作业参数说明参数说明示例 bootstrap.servers Kafka的Broker实例业务IP和端口。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > PyFlink样例程序
获取已经同步的IAM用户和用户组 - MapReduce服务 MRS

请参见如何调用API。 URI GET /v2/{project_id}/clusters/{cluster_id}/iam-sync-user 表1 路径参数参数是否必选参数类型描述 project_id 是 String 参数解释：项目编号。获取方法，请参见获取项目ID。约束限制：

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > IAM同步管理接口
PyFlink样例程序代码说明 - MapReduce服务 MRS

print("------------------read_write_kafka----------------") read_write_kafka() 表1 使用Python提交普通作业参数说明参数说明示例 bootstrap.servers Kafka的Broker实例业务IP和端口。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > PyFlink样例程序
Flink Job Pipeline增强 - MapReduce服务 MRS

“deleteTopicNode();”：删除Topic节点。 “unregister();”：删除注册信息。 “query(); ”：查询注册信息。 “isExist();”：查找某个信息是否存在。 “shutdown(); ”：关闭RegisterServerHandler，与第三方RegisterServer断开连接。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
FlinkSQL OVER窗口支持超期退窗 - MapReduce服务 MRS

有新数据到来时，OVER聚合结果刷新并向下游算子发送最新的计算结果，可通过over.window.interval配置该功能，配置如下：表1 FlinkSQL OVER窗口数据超期退窗功能参数名称默认值说明 over.window.interval -1 相邻2条数据的时

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
配置FlinkServer作业中添加第三方依赖jar - MapReduce服务 MRS

WebUI，请参考访问FlinkServer WebUI界面。单击“依赖管理”进入依赖管理页面。单击“添加依赖”，可参考如下添加依赖。表1 添加依赖参数描述示例是否自定义connector 是否自定义connector，根据实际需求选择：是：文件为自定义connector依赖包。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 管理FlinkServer作业
Yarn-client模式提交Spark任务时ApplicationMaster尝试启动两次失败 - MapReduce服务 MRS

执行一遍。如果出现Escape character is '^]'类似打印则说明可以连通，如果出现connection refused则表示失败，无法连接到相关端口。如果相关端口打开，但是从别的节点无法连通到该端口，则需要排查下相关网络配置。 23662这个端口每次都是随机的

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
Spark Streaming性能调优 - MapReduce服务 MRS

个数分组，每个分组会单独创建一个文件记录日志，从而避免应用长期运行时形成单个过大日志造成JobHistory无法读取的问题，设置为“0”时表示不分组。大部分Spark Streaming任务属于小型job，而且产生速度较快，会导致频繁的分组，产生大量日志小文件消耗磁盘I/O。建

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）

总条数： 5304

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Spark Streaming对接Kafka时数据后进先出功能 - MapReduce服务 MRS

管理MRS角色实例 - MapReduce服务 MRS

集群在线扩缩容 - MapReduce服务 MRS

ZooKeeper开源增强特性 - MapReduce服务 MRS

配置AM自动调整分配内存 - MapReduce服务 MRS

配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

什么是区域和可用区？ - MapReduce服务 MRS

配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

使用KafkaStreams统计数据 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

使用KafkaStreams统计数据 - MapReduce服务 MRS

PyFlink样例程序代码说明 - MapReduce服务 MRS

获取已经同步的IAM用户和用户组 - MapReduce服务 MRS

PyFlink样例程序代码说明 - MapReduce服务 MRS

Flink Job Pipeline增强 - MapReduce服务 MRS

FlinkSQL OVER窗口支持超期退窗 - MapReduce服务 MRS

配置FlinkServer作业中添加第三方依赖jar - MapReduce服务 MRS

Yarn-client模式提交Spark任务时ApplicationMaster尝试启动两次失败 - MapReduce服务 MRS

Spark Streaming性能调优 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线