搜索_华为云

Flink DataStream样例程序开发思路 - MapReduce服务 MRS

txt"和"/opt/log2.txt"。数据文件若存放在本地文件系统，需在所有部署Yarn NodeManager的节点指定目录放置，并设置运行用户访问权限。或将数据文件放置于HDFS，并指定程序中读取文件路径HDFS路径，例如"hdfs://hacluster/path/to/file"。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink DataStream样例程序
Flink DataStream样例程序开发思路 - MapReduce服务 MRS

txt"和"/opt/log2.txt"。数据文件若存放在本地文件系统，需在所有部署Yarn NodeManager的节点指定目录放置，并设置运行用户访问权限。若将数据文件放置于HDFS，需指定程序中读取文件路径HDFS路径，例如"hdfs://hacluster/path/to/file"。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink DataStream样例程序
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

到此“/home/data”目录下。将Kafka的Broker配置参数“allow.everyone.if.no.acl.found”值设置为“true”(普通集群不需配置)。启动样例代码的Producer，向Kafka发送数据。 java -cp $SPARK_HOME/j

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming程序
执行balance失败报错“Source and target differ in block-size” - MapReduce服务 MRS

distcp默认拷贝文件时不记录原block大小导致在原文件block.size不是128M时校验失败，需要在distcp命令增加-pb参数。原因分析 HDFS在写的时候有设置块大小，默认128M，某些组件或者业务程序写入的文件可能不是128M，如8M。 <name>dfs.blocksize</name> <v

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
JSON表中有破损数据导致Hive查询异常 - MapReduce服务 MRS

ALTER TABLE test SET SERDEPROPERTIES( "ignore.malformed.json" = "true"); 设置该属性后，查询表时若表中有破损的JSON数据默认显示为“NULL”。执行以下命令查询表数据： select * from test; 数

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
配置Hive列加密功能 - MapReduce服务 MRS

使用序号指定加密列时，序号从0开始。0代表第1列，1代表第2列，依次类推。创建列加密表时，表所在的目录必须是空目录。使用insert语法向设置列加密的表中导入数据。假设test表已存在且有数据： insert into table <table_name> select <col_list>

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive数据存储及加密配置
ALM-14011 HDFS DataNode数据目录配置不合理（2.x及以前版本） - MapReduce服务 MRS

实例”，重启该DataNode实例。检查该告警是否恢复。是，处理完毕。否，执行7。收集故障信息。在MRS Manager界面，单击“系统设置 > 日志导出”。请联系运维人员，并发送已收集的故障日志信息。参考信息无。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12180 磁盘卡IO - MapReduce服务 MRS

在FusionInsight Manager界面，选择“运维 > 日志 > 下载”。在“服务”中勾选“OMS”，单击“确定”。单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟，单击“下载”。请联系运维人员，并发送已收集的故障日志信息。告警清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

这个问题的原因是拷贝任务运行时所需的内存超过了客户端设置的内存上限（默认为128MB）。可以通过修改“<客户端安装路径>/HDFS/component_env”中的“CLIENT_GC_OPTS”来修改客户端的内存上限。例如，需要设置该内存上限为1GB，则设置： CLIENT_GC_OPTS="-Xmx1G"

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
开源Kylin 3.x与MRS 1.9.3对接时存在Jetty兼容性问题如何处理？ - MapReduce服务 MRS

级，导致开源Kylin与MRS 1.9.3版本进行对接时存在Jetty版本的兼容性问题。按以下步骤进行操作可以完成部署和对接。在一个ECS节点进行MRS Client安装，具体请参考集群外节点使用MRS客户端。本操作以MRS客户端安装路径为“/srv/client/”为例进行说明。

帮助中心 > MapReduce服务 MRS > 常见问题 > 周边生态对接类
配置SparkSQL业务用户权限 - MapReduce服务 MRS

Base表，授予权限后可以使用SparkSQL访问HBase表。以授予用户在SparkSQL中查询HBase表的权限为例，操作步骤如下：设置“spark.yarn.security.credentials.hbase.enabled”为“true”。在Manager角色界面创

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark用户权限管理
配置SparkSQL业务用户权限 - MapReduce服务 MRS

Base表，授予权限后可以使用SparkSQL访问HBase表。以授予用户在SparkSQL中查询HBase表的权限为例，操作步骤如下：设置“spark.yarn.security.credentials.hbase.enabled”为“true”。在Manager角色界面创

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

语句，执行3。使用spark-beeline运行SQL语句，执行4。执行SQL语句时，需要添加参数“--driver-memory”，设置内存大小，例如： /spark-sql --master=local[4] --driver-memory=512M -f /tpch.sql

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
准备本地应用开发环境 - MapReduce服务 MRS

JDK默认只支持TLS V1.0，若使用IBM JDK，请配置启动参数“com.ibm.jsse2.overrideDefaultTLS”为“true”，设置后可以同时支持TLS V1.0/V1.1/V1.2，详情可参考https://www.ibm.com/support/knowledgecenter/zh/SSYKE2_8

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 准备Flink应用开发环境
在本地Windows环境中调测MapReduce应用 - MapReduce服务 MRS

打开MultiComponentLocalRunner.java，确认代码中System.setProperty("HADOOP_USER_NAME", "root");设置了用户为root，请确保场景说明中上传的数据的用户为root，或者在代码中将root修改为上传数据的用户名。在IntelliJ IDEA

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式） > 调测MapReduce应用
配置Kafka后进先出 - MapReduce服务 MRS

用重新启动后C段时间的任务启用流控功能。配置描述在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.streaming.kafka.direct.lifo 配置是否开启Kafka后进先出功能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Streaming企业级能力增强
Hive应用开发建议 - MapReduce服务 MRS

Hive提供的JDBC实现有超时限制，默认是5分钟，用户可以通过java.sql.DriverManager.setLoginTimeout(int seconds)设置，seconds的单位为秒。 UDF管理建议由管理员创建永久UDF，避免每次使用时都去add jar，和重新定义UDF。 Hive的UD

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hive应用开发规范
查看FlinkServer作业健康状况 - MapReduce服务 MRS

提交作业前，需配置“客户端安装路径/Flink/flink/conf/flink-conf.yaml”文件，开启作业注册到FlinkServer功能和作业告警功能，参数设置如下：表1 开启作业注册和作业告警功能参数值描述 job.register.enable true 是否开启作业注册到FlinkServer：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 管理FlinkServer作业
配置Spark Streaming对接Kafka时数据后进先出功能 - MapReduce服务 MRS

用重新启动后C段时间的任务启用流控功能。配置描述在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.streaming.kafka.direct.lifo 配置是否开启Kafka后进先出功能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Streaming企业级能力增强
StarRocks - MapReduce服务 MRS
StarRocks - MapReduce服务 MRS

模型在查询时不需要执行聚合操作，并且支持谓词和索引下推，能够在支持实时和频繁更新等场景的同时，提供高效查询。数据分布建表时，您可以通过设置合理的分区和分桶，实现数据均匀分布和查询性能提升。数据均匀分布是指数据按照一定规则划分为子集，并且均衡地分布在不同节点上。查询时能够有效裁

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍

总条数： 2894

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink DataStream样例程序开发思路 - MapReduce服务 MRS

Flink DataStream样例程序开发思路 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

执行balance失败报错“Source and target differ in block-size” - MapReduce服务 MRS

JSON表中有破损数据导致Hive查询异常 - MapReduce服务 MRS

配置Hive列加密功能 - MapReduce服务 MRS

ALM-14011 HDFS DataNode数据目录配置不合理（2.x及以前版本） - MapReduce服务 MRS

ALM-12180 磁盘卡IO - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

开源Kylin 3.x与MRS 1.9.3对接时存在Jetty兼容性问题如何处理？ - MapReduce服务 MRS

配置SparkSQL业务用户权限 - MapReduce服务 MRS

配置SparkSQL业务用户权限 - MapReduce服务 MRS

多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

在本地Windows环境中调测MapReduce应用 - MapReduce服务 MRS

配置Kafka后进先出 - MapReduce服务 MRS

Hive应用开发建议 - MapReduce服务 MRS

查看FlinkServer作业健康状况 - MapReduce服务 MRS

配置Spark Streaming对接Kafka时数据后进先出功能 - MapReduce服务 MRS

StarRocks - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线