搜索_华为云

经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Int)相同，会将数据通过Shuffle的方式重新分区；当shuffle为false的时候，则只是简单的将父RDD的多个partition合并到同一个task进行计算，shuffle为false时，如果numPartitions大于父RDD的切片数，那么分区不会重新调整。遇到下列场景，可选择使用coalesce算子

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

方案架构 Hive数据迁移分两部分内容： Hive的元数据信息，存储在MySQL等数据库中。MRS Hive集群的元数据会默认存储到MRS DBService组件，也可以选择RDS（MySQL）作为外置元数据库。 Hive的业务数据，存储在HDFS文件系统或OBS对象存储中。图1

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Spark SQL join优化 - MapReduce服务 MRS

tableName COMPUTE STATISTICS noscan;）更新表元数据后进行广播。需要广播的表是分区表，新建表且文件类型为非Parquet文件类型。需要广播的表是分区表，更新表数据后。参考信息被广播的表执行超时，导致任务结束。默认情况下，BroadCastJoin

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
PMS进程占用内存高 - MapReduce服务 MRS

主Master节点内存使用率高，且用top -c命令查询的内存占用量高的是如下idle的进程。原因分析 PostgreSQL缓存：除了常见的执行计划缓存、数据缓存，PostgreSQL为了提高生成执行计划的效率，还提供了catalog，relation等缓存机制。长连接场景下这些缓存

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
配置Flink读写Doris数据 - MapReduce服务 MRS

需先执行以下命令再连接Doris数据库： export LIBMYSQL_ENABLE_CLEARTEXT_PLUGIN=1 mysql -u数据库登录用户 -p数据库登录用户密码 -P数据库连接端口 -hDoris FE实例IP地址数据库连接端口为Doris FE的查询连接

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris支持多源数据
查询Impala数据 - MapReduce服务 MRS

加载进表employees_info_extended中的入职时间为2014的分区中. INSERT OVERWRITE TABLE employees_info_extended PARTITION (entrytime = '2014') SELECT a.id,

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 开发Impala应用
配置MRS集群审计日志转储 - MapReduce服务 MRS

指定转储模式 “按数量”：日志到达指定条数（默认10万条）时开始转储 “按时间”：指定某一日期开始转储，转储频率为一年一次。转储日期 11-06 当选择“按时间”转储模式时可用。选择一个转储日期后，系统将在此日期开始转储。转储的日志范围为当前年份1月1日0时之前的所有审计日志。 SFTP公

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
DROP SCHEMA - MapReduce服务 MRS
DROP SCHEMA - MapReduce服务 MRS

语法 DROP (DATABASE|SCHEMA) [IF EXISTS] databasename [RESTRICT|CASCADE] 描述 DATABASE和SCHEMA在概念上是等价可互换的。该语法用于删除数据库databasename，如果目标数据库不存在，将抛出错误提示，但如果使用了IF

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DDL SQL语法说明
FlinkSQL写入JDBC数据支持ignoreDelete - MapReduce服务 MRS

'url' = 'jdbc:mysql://MySQL的服务器IP:MySQL的服务器端口/mysql', 'table-name' = 'customer_t1', 'username' = 'username', --连接MySQL数据库的用户名 'password'

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
SQL和DataFrame - MapReduce服务 MRS
SQL和DataFrame - MapReduce服务 MRS

Spark SQL无法查询到Parquet类型的Hive表的新插入数据 cache table使用指导 Repartition时有部分Partition没数据 16T的文本数据转成4T Parquet数据失败当表名为table时，执行相关操作时出现异常执行analyze table语句，因资源不足出现任务卡住

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题
使用hcatalog方式同步hive parquet表报错 - MapReduce服务 MRS

使用hcatalog方式同步hive parquet表报错问题同步hive parquet表，其分区字段为非string类型，无法正常使用hive import导入，只能考虑使用hcatalog方式，但是hcatalog方式报错如下：回答修改sqoop源码SqoopHCa

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop > Sqoop常见问题
Impala客户端使用实践 - MapReduce服务 MRS

user_info where id='12005000201'; 删除用户信息表。 drop table user_info; 外部分区表的操作：创建外部分区表并导入数据创建外部表数据存储路径。 kinit hive （安全模式需要执行kinit，普通模式无需执行）用户hive需要具有Hive管理员权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Impala
ANALYZE - MapReduce服务 MRS
ANALYZE - MapReduce服务 MRS

统计catalog hive、schema default下的表存储： ANALYZE hive.default.orders; 从hive分区表中统计分区'2020-07-17' , '2020-07-18'信息： ANALYZE hive.web.page_views WITH (partitions

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine辅助命令语法
ClickHouse DataBase设计 - MapReduce服务 MRS

ClickHouse DataBase设计业务隔离设计-各业务分库设计在业务规划时，不同业务归属于不同数据库，便于后续对应用户关联的数据库下表、视图等数据库对象权限的分离管理和维护。业务隔离设计-不要在system库中创建业务表 system数据库是ClickHouse默认

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库设计
Doris集群高可用方案概述 - MapReduce服务 MRS

is FE节点地址，做侵入式修改。 SDK 服务通过MySQL协议与Doris建立连接，部分语言的SDK已经提供了高可用能力，例如MySQL JDBC可以使用自动重试机制，建立连接时通过如下配置设置数据源： jdbc:mysql:loadbalance://[host1][:port]

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris高可用功能
添加Hive的Ranger访问权限策略 - MapReduce服务 MRS

20或者192.168.1.*。 Policy Label 为当前策略指定一个标签，您可以根据这些标签搜索报告和筛选策略。 database 将适用该策略的列Hive数据库名称。 “Include”策略适用于当前输入的对象，“Exclude”表示策略适用于除去当前输入内容之外的其他对象。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x） > Ranger权限策略配置示例
Repartition时有部分Partition没数据 - MapReduce服务 MRS

的partition，实际上却只有2000个partition里有数据，不同key对应的数据也被分到相同的partition里。回答这是正常现象。数据分到哪个partition是通过对key的hashcode取模得到的，不同的hashcode取模后的结果有可能是一样的，那样

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
Loader开源增强特性 - MapReduce服务 MRS

支持从Phoenix表导出数据到关系型数据库支持从Oracle分区表导入数据到HDFS/OBS 支持从Oracle分区表导入数据到HBase表支持从Oracle分区表导入数据到Phoenix表支持从Oracle分区表导入数据到Hive表支持从HDFS/OBS导出数据到Oracle分区表支持从HBase导出数据到Oracle分区表

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Loader
Hive执行msck repair table命令时报错 - MapReduce服务 MRS

hiveserver/hive.log”，发现目录名不符合分区格式。处理步骤方法一：删除错误的文件或目录。方法二：执行set hive.msck.path.validation=skip;，跳过无效的目录。父主题：使用Hive

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
Flink Kafka样例程序开发思路 - MapReduce服务 MRS

{zkQuorum} ZooKeeper集群信息，格式为IP:port。 {partitionNum} topic的分区数。 {replicationNum} topic中每个partition数据的副本数。 {Topic} topic名称。示例：在Kafka的客户端路径下执行命令，此处以Zo

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Kafka样例程序

总条数： 3841

上一页
1
...
17
18
19
...
193
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

经验总结 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

PMS进程占用内存高 - MapReduce服务 MRS

配置Flink读写Doris数据 - MapReduce服务 MRS

查询Impala数据 - MapReduce服务 MRS

配置MRS集群审计日志转储 - MapReduce服务 MRS

DROP SCHEMA - MapReduce服务 MRS

FlinkSQL写入JDBC数据支持ignoreDelete - MapReduce服务 MRS

SQL和DataFrame - MapReduce服务 MRS

使用hcatalog方式同步hive parquet表报错 - MapReduce服务 MRS

Impala客户端使用实践 - MapReduce服务 MRS

ANALYZE - MapReduce服务 MRS

ClickHouse DataBase设计 - MapReduce服务 MRS

Doris集群高可用方案概述 - MapReduce服务 MRS

添加Hive的Ranger访问权限策略 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

Loader开源增强特性 - MapReduce服务 MRS

Hive执行msck repair table命令时报错 - MapReduce服务 MRS

Flink Kafka样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线