搜索_华为云

Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

wordCounts = words.groupBy("word").count() # 开始运行将running counts打印到控制台的查询 query = wordCounts.writeStream\ .outputMode("complete")\

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Hue中的输入框输入中文会出现混乱 - MapReduce服务 MRS

行修正。处理步骤该方案仅适用于MRS 2.x及之前版本集群。登录MRS Manager页面，选择“服务管理 > Hue > 实例”，查询Hue实例所在的节点的IP。使用root用户远程连接工具登录Hue实例所在节点的机器，并执行如下命令切换到omm用户。 su - omm

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hue
SparkSQL建表参数规范 - MapReduce服务 MRS

hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Metastore中。由于缺失新写入的分区信息，查询引擎读取该时会丢数。禁止指定Hudi的索引类型为INMEMORY类型。该索引仅是为了测试使用。生产环境上使用该索引将导致数据重复。建表示例

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范 > Spark读写Hudi开发规范
CarbonData表空间索引语法说明 - MapReduce服务 MRS

polygon连接查询 IN_POLYGON_JOIN(GEO_HASH_INDEX_COLUMN, POLYGON_COLUMN) 两张表做join查询，一张表为空间数据表（有经纬度列和GeoHashIndex列），另一张表为维度表，保存polygon数据。查询使用IN_POLYGON_JOIN

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考
compaction&cleaning配置 - MapReduce服务 MRS

cleaner.policy 要使用的清理策略。Hudi将删除旧版本的parquet文件以回收空间。任何引用此版本文件的查询和计算都将失败。需要确保数据保留的时间超过最大查询执行时间。 KEEP_LATEST_COMMITS hoodie.cleaner.commits.retained

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

只有当output mode为complete时才支持排序操作。有条件地支持流和静态数据集之间的外连接。不支持部分DataSet上立即运行查询并返回结果的操作： count()：无法从流式Dataset返回单个计数，而是使用ds.groupBy().count()返回一个包含运行计数的streaming

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
Spark从HBase读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

通过HBase插入数据，命令如下： put 'table2', '1', 'cf:cid', '1000' 开发思路查询table1表的数据。根据table1表数据的key值去table2表做查询。把前两步相应的数据记录做相加操作。把上一步骤的结果写到table2表。运行前置操作安全模式下Spark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序
CarbonData表空间索引语法说明 - MapReduce服务 MRS

polygon连接查询 IN_POLYGON_JOIN(GEO_HASH_INDEX_COLUMN, POLYGON_COLUMN) 两张表做join查询，一张表为空间数据表（有经纬度列和GeoHashIndex列），另一张表为维度表，保存polygon数据。查询使用IN_POLYGON_JOIN

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

flatMap(_.split(" ")).groupBy("value").count() //开始运行将运行计数打印到控制台的查询。 val query = wordCounts.writeStream .outputMode("complete")

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Structured Streaming程序
ADD COLUMNS - MapReduce服务 MRS
ADD COLUMNS - MapReduce服务 MRS

将被忽略。如果未指定默认值，则新列的默认值将被视为null。如果在该列上应用filter，则在排序期间不会考虑新增列，新增列可能会影响查询性能。示例 ALTER TABLE carbon ADD COLUMNS (a1 INT, b1 STRING); ALTER TABLE

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
Flume日志采集概述 - MapReduce服务 MRS

通过同时利用Flume服务端和客户端，构成Flume的级联任务，采集日志的流程如下所示。安装Flume客户端。配置Flume服务端和客户端参数。查看Flume客户端收集日志。停止及卸载Flume客户端。图1 Flume使用流程 Flume模块介绍 Flume客户端/服务端由一个或多

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
Spark Structured Streaming样例程序（Java） - MapReduce服务 MRS

Encoders.STRING()).groupBy("value").count(); //开始运行将运行计数打印到控制台的查询。 StreamingQuery query = wordCounts.writeStream() .outputMode("complete")

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Loader算子配置项中使用宏定义 - MapReduce服务 MRS

指定以当天时间命名的数据目录参数项配置为“/user/data/inputdate_@{dateformat("yyyy-MM-dd")}@”。通过SQL语句查询最近7天的数据 select * from table where time between '@{dateformat("yyyy-MM-dd

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助
配置项中使用宏定义 - MapReduce服务 MRS

指定以当天时间命名的数据目录参数项配置为“/user/data/inputdate_@{dateformat("yyyy-MM-dd")}@”。通过SQL语句查询最近7天的数据 select * from table where time between '@{dateformat("yyyy-MM-dd

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助
ADD COLUMNS - MapReduce服务 MRS
ADD COLUMNS - MapReduce服务 MRS

将被忽略。如果未指定默认值，则新列的默认值将被视为null。如果在该列上应用filter，则在排序期间不会考虑新增列，新增列可能会影响查询性能。示例 ALTER TABLE carbon ADD COLUMNS (a1 INT, b1 STRING); ALTER TABLE

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DDL
Hive客户端执行SQL报错连接超时 - MapReduce服务 MRS

打开配置文件“${BIGDATA_HOME}/FusionInsight_Current/*HiveServer/etc/hivemetastore-site.xml”，查找配置项“javax.jdo.option.ConnectionURL”，复制配置项值。登录Manager页面，选择“集群 > 服务 > Hive

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
HDFS HTTP REST API接口介绍 - MapReduce服务 MRS

单击链接，如图1所示。图1 创建目录样例命令进入到客户端的安装目录下，此处为“/opt/client”，创建名为“huawei”的目录。执行下列命令，查看当前是否存在名为“huawei”的目录。 hdfs dfs -ls / 执行结果如下： linux1:/opt/client # hdfs

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式） > HDFS应用开发常见问题 > HDFS常用API介绍
Flume日志采集概述 - MapReduce服务 MRS

通过同时利用Flume服务端和客户端，构成Flume的级联任务，采集日志的流程如下所示。安装Flume客户端。配置Flume服务端和客户端参数。查看Flume客户端收集日志。停止及卸载Flume客户端。图1 Flume使用流程 Flume模块介绍 Flume客户端/服务端由一个或多

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
HDFS文件系统目录简介 - MapReduce服务 MRS

cli方式运行metastore session临时文件否任务运行失败 /tmp/logs/ 固定目录存放container日志文件是 container日志不可查看 /tmp/carbon/ 固定目录数据导入过程中，如果存在异常CarbonData数据，则将异常数据放在此目录下是错误数据丢失 /

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
添加HDFS的Ranger访问权限策略 - MapReduce服务 MRS

Zone”。单击“Save”保存。如需添加多条策略有效期，可单击按钮添加。如需删除策略有效期，可单击按钮删除。单击“Add”，在策略列表可查看策略的基本信息。等待策略生效后，验证相关权限是否正常。如需禁用某条策略，可单击按钮编辑策略，设置策略开关为“Disabled”。如果不再使用策略，可单击按钮删除策略。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Ranger > Ranger权限策略配置示例

总条数： 3726

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

Hue中的输入框输入中文会出现混乱 - MapReduce服务 MRS

SparkSQL建表参数规范 - MapReduce服务 MRS

CarbonData表空间索引语法说明 - MapReduce服务 MRS

compaction&cleaning配置 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

CarbonData表空间索引语法说明 - MapReduce服务 MRS

Scala样例代码 - MapReduce服务 MRS

ADD COLUMNS - MapReduce服务 MRS

Flume日志采集概述 - MapReduce服务 MRS

Spark Structured Streaming样例程序（Java） - MapReduce服务 MRS

Loader算子配置项中使用宏定义 - MapReduce服务 MRS

配置项中使用宏定义 - MapReduce服务 MRS

ADD COLUMNS - MapReduce服务 MRS

Hive客户端执行SQL报错连接超时 - MapReduce服务 MRS

HDFS HTTP REST API接口介绍 - MapReduce服务 MRS

Flume日志采集概述 - MapReduce服务 MRS

HDFS文件系统目录简介 - MapReduce服务 MRS

添加HDFS的Ranger访问权限策略 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线