搜索_华为云

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffl

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffl

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
zstd压缩算法有什么优势？ - MapReduce服务 MRS

zstd压缩算法有什么优势？问： zstd压缩算法有什么优势？答： ZSTD（全称为Zstandard）是一种开源的无损数据压缩算法，其压缩性能和压缩比均优于当前Hadoop支持的其他压缩格式。具体详细请参考https://github.com/L-Angel/compress-demo。

帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
聚合算法优化 - MapReduce服务 MRS

聚合算法优化操作场景在Spark SQL中支持基于行的哈希聚合算法，即使用快速聚合hashmap作为缓存，以提高聚合性能。hashmap替代了之前的ColumnarBatch支持，从而避免拥有聚合表的宽模式（大量key字段或value字段）时产生的性能问题。操作步骤要启动

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
聚合算法优化 - MapReduce服务 MRS

聚合算法优化操作场景在Spark SQL中支持基于行的哈希聚合算法，即使用快速聚合hashmap作为缓存，以提高聚合性能。hashmap替代了之前的ColumnarBatch支持，从而避免拥有聚合表的宽模式（大量key字段或value字段）时产生的性能问题。操作步骤要启动

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
配置Flink认证和加密 - MapReduce服务 MRS

c40a9 说明：用户需要获取SSL证书，放置到Flink客户端中。具体操作可参考签发Flink证书样例。使用MRS客户端预制“generate_keystore.sh”脚本获取SSL证书有效期为5年。参考签发Flink证书样例获取的SSL证书有效期为10年。若要关闭默认的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink用户权限管理
HyperLogLog函数 - MapReduce服务 MRS
HyperLogLog函数 - MapReduce服务 MRS

rox_distinct（）函数。数据结构 HyperLogLog（hll）是一种统计基数的算法。它实际上不会存储每个元素出现的次数，它使用的是概率算法，通过存储元素的32位hash值的第一个1的位置，来计算元素数量。通常分为稀疏存储结构和密集存储结构两种。hll创建时是稀疏存

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
配置Flink对接Kafka安全认证 - MapReduce服务 MRS

配置Flink对接Kafka安全认证 Flink样例工程的数据存储在Kafka组件中。向Kafka组件发送数据（需要有Kafka权限用户），并从Kafka组件接收数据。确保集群安装完成，包括HDFS、Yarn、Flink和Kafka。创建Topic。用户使用Linux命令行

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink用户权限管理
在本地Windows环境中调测Oozie应用 - MapReduce服务 MRS

环境中运行应用。本地和集群业务平面网络互通时，您可以直接在本地进行调测。操作步骤在Windows本地运行程序，需要配置HTTPS SSL证书。登录集群任意节点，进入如下目录下载ca.crt文件。 cd ${BIGDATA_HOME}/om-agent_8.1.0.1/nod

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > 调测Oozie应用
在本地Windows环境中调测Oozie应用 - MapReduce服务 MRS

环境中运行应用。本地和集群业务平面网络互通时，您可以直接在本地进行调测。操作步骤在Windows本地运行程序，需要配置https ssl证书。登录集群任意节点，进入如下目录下载ca.crt文件。 cd ${BIGDATA_HOME}/om-agent_8.1.0.1/nod

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（安全模式） > 调测Oozie应用
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

artition，即一个Task。在有很多小文件时，Spark会启动很多Task，此时当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数，严重影响系统性能。针对小文件很多的场景，DataSource在创建RDD时，先将Table中的split生成Partition

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
在本地Windows环境中调测Oozie应用 - MapReduce服务 MRS

环境中运行应用。本地和集群业务平面网络互通时，您可以直接在本地进行调测。操作步骤在Windows本地运行程序，需要配置https ssl证书。登录集群任意节点，进入如下目录下载ca.crt文件。 cd ${BIGDATA_HOME}/om-agent_8.1.2.2/nod

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（普通模式） > 调测Oozie应用
在本地Windows环境中调测Oozie应用 - MapReduce服务 MRS

环境中运行应用。本地和集群业务平面网络互通时，您可以直接在本地进行调测。操作步骤在Windows本地运行程序，需要配置https ssl证书。登录集群任意节点，进入如下目录下载ca.crt文件。 cd ${BIGDATA_HOME}/om-agent_8.1.2.2/nod

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（安全模式） > 调测Oozie应用
配置多主实例与多租户模式切换 - MapReduce服务 MRS

_conf__/fairscheduler.xml spark.proxyserver.hash.enabled 是否使用Hash算法连接ProxyServer。 true为使用Hash算法，使用多租户模式时，该参数需配置为true。 false为使用随机连接，多主实例模式，配置为false。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强 > 配置Spark HA增强高可用
Flink客户端执行命令报错“Could not connect to the leading JobManager” - MapReduce服务 MRS

Futures timed out after [10000 milliseconds] 可能原因 Flink开启了SSL通信加密，却没有正确的配置SSL证书。解决办法针对MRS 2.x及之前版本，操作如下：方法1：关闭Flink SSL通信加密，修改客户端配置文件“conf/flink-conf

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flink
FlinkSQL Kafka表开发建议 - MapReduce服务 MRS

limit) 为保证数据准确性将同key数据写入Kafka的同一个分区 Flink写Kafka使用fixed策略，并在写入之前根据key进行Hash。【示例】 CREATE TABLE kafka ( f_sequence INT, f_sequence1 INT, f_sequence2

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > FlinkSQL Connector开发规范
导入并配置IoTDB样例工程 - MapReduce服务 MRS

xample样例代码，需进行以下操作：需放置准备集群认证用户信息获取到的认证文件“user.keytab”和“krb5.conf”及SSL证书文件“truststore.jks”到各样例工程的“..\src\main\resources”目录下。配置各样例工程的“..\src

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（安全模式） > 准备IoTDB应用开发环境
提交Flink作业时报错slot request timeout如何处理？ - MapReduce服务 MRS

是否成功来判断。如果集群为安全集群，可能是Flink的SSL证书配置错误，或者证书过期。解决方法增加队列的资源。排除用户jar包中的Flink和Hadoop依赖，依赖环境中的jar包。重新配置Flink的SSL证书，可参考从零开始使用Flink。父主题：作业管理类

 帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
配置多主实例与多租户模式切换 - MapReduce服务 MRS

_conf__/fairscheduler.xml spark.proxyserver.hash.enabled 是否使用Hash算法连接ProxyServer。 true为使用Hash算法，使用多租户模式时，该参数需配置为true。 false为使用随机连接，多主实例模式，配置为false。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强 > 配置Spark HA增强高可用
Hudi表索引设计规范 - MapReduce服务 MRS

布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。 Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写入；该索引写入速度最快，但是需要合理配置分桶数目；Flink、Spark均支持该索引写入。状态索引：Flink引

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范

总条数： 465

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

zstd压缩算法有什么优势？ - MapReduce服务 MRS

聚合算法优化 - MapReduce服务 MRS

聚合算法优化 - MapReduce服务 MRS

配置Flink认证和加密 - MapReduce服务 MRS

HyperLogLog函数 - MapReduce服务 MRS

配置Flink对接Kafka安全认证 - MapReduce服务 MRS

在本地Windows环境中调测Oozie应用 - MapReduce服务 MRS

在本地Windows环境中调测Oozie应用 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

在本地Windows环境中调测Oozie应用 - MapReduce服务 MRS

在本地Windows环境中调测Oozie应用 - MapReduce服务 MRS

配置多主实例与多租户模式切换 - MapReduce服务 MRS

Flink客户端执行命令报错“Could not connect to the leading JobManager” - MapReduce服务 MRS

FlinkSQL Kafka表开发建议 - MapReduce服务 MRS

导入并配置IoTDB样例工程 - MapReduce服务 MRS

提交Flink作业时报错slot request timeout如何处理？ - MapReduce服务 MRS

配置多主实例与多租户模式切换 - MapReduce服务 MRS

Hudi表索引设计规范 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线