搜索_华为云

Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

FemaleInfoCollectionPrint： // 参数解析: // <batchTime>为Streaming分批的处理间隔。 // <windowTime>为统计数据的时间跨度,时间单位都是秒。 // <topics>为Kafka中订阅的主题，多以逗号分隔。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming程序
Hive CBO原理介绍 - MapReduce服务 MRS

colum_a='value1'; 则估算查询的最终条数为1000000 * 1/50 = 20000条，选择率为2%。以下以TPC-DS Q3为例来介绍CBO是如何调整Join顺序的。 select dt.d_year, item.i_brand_id brand_id,

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

重不一致。需要重新设计key，以更小粒度的key使得task大小合理化。修改并行度。优化数据结构把数据按列存放，读取数据时就可以只扫描需要的列。使用Hash Shuffle时，通过设置spark.shuffle.consolidateFiles为true，来合并shuf

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
参考Hive JDBC代码用例开发的业务应用运行失败 - MapReduce服务 MRS

e-site.xml配置文件，此配置文件上设置“hadoop.security.authentication”为“kerberos”。解决办法属于用户使用不当。对于本业务应用来说，若要解决此问题，可以参考如下几种办法：方法1：直接参考Hive组件的“jdbc-examples”样例工程，将core-site

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
Spark CBO调优 - MapReduce服务 MRS
Spark CBO调优 - MapReduce服务 MRS

新的数据分布情况。表：执行COMPUTE STATS FOR TABLE src命令计算表的统计信息，统计信息包括记录条数、文件数和物理存储总大小。列：执行COMPUTE STATS FOR TABLE src ON COLUMNS命令计算所有列的统计信息。执行COMPUTE

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优
典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

HTML输入文件输出固定宽度文件输入文件输出图3 算子操作方法示意设置数据保存信息并运行作业单击“下一步”，进入“输出设置”界面，在“存储类型”中选择“HDFS”，设置数据保存方式。表4 输出设置参数参数名说明示例文件类型文件导入后保存的类型： “TEXT_FILE”：导入文本文件并保存为文本文件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
开源sqoop-shell工具使用指导 - MapReduce服务 MRS

口，用户输入脚本后，工具会返回相应信息到交互窗口。批量模式通过执行“sqoop2-shell”脚本，带一个文件名作为参数，该文件中按行存储了多条命令，sqoop-shell工具将会按顺序执行文件中所有命令；或者在“sqoop2-shell”脚本后面通过“-c”参数附加一条命令，一次只执行一条命令。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
使用多级agent串联从本地采集静态日志保存到HDFS - MapReduce服务 MRS

/srv/BigData/hadoop/data1/flumeserver/checkpoint transactionCapacity 事务大小：即当前channel支持事务处理的事件个数。建议和Source的batchSize设置为同样大小，不能小于batchSize。 61200 hdfs.path 写入HDFS的目录，此参数不能为空。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume加密传输数据采集任务
Flink作业大小表Join能力增强 - MapReduce服务 MRS

JOIN时小表为右表。 Flink作业大小表Join去重在双流关联的业务模型中，关联算子接收到其中一个流发送的大量重复数据，则会导致下游算子需要处理大量重复数据，影响作业性能。如A表字段（P1，A1，A2）使用如下方式关联B表字段（P1，B1，B2，B3）生成C的场景中，B表信息发生

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
配置Spark动态脱敏 - MapReduce服务 MRS

则推荐使用“Nullify”脱敏策略。对于不支持的数据类型，如果配置了脱敏策略或输出列涉及脱敏传递，最终都按“Nullify”脱敏策略处理。配置Spark动态脱敏修改JDBCServer实例配置，登录FusionInsight Manager页面，选择“集群 > 服务 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
schedule-tool工具使用指导 - MapReduce服务 MRS

format”一致。 yyyyMMdd file.format.iscompressed 待导入的文件是否为压缩文件。 false storage.type 存储类型。待导入文件最终保存的类型，分别有HDFS、HBase、Hive等。 HDFS schedule-tool工具支持同时配置多个作业。配置多个作业时，表2中“job

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
Spark客户端使用实践 - MapReduce服务 MRS

taken: 0.18 seconds, Fetched 1 row(s) 查看Spark应用运行结果。通过指定文件查看运行结果数据。结果数据的存储路径和格式由Spark应用程序指定。通过Web页面查看运行情况。登录Manager主页面。在服务中选择Spark2x。进入Spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

据分布均匀和查询吞吐均衡。数据均匀是为了避免某些桶的数据存在倾斜影响数据均衡和查询效率。查询吞吐利用查询SQL的分桶剪裁优化避免了全桶扫描，以提升查询性能。分桶列的选取：优先考虑数据较为均匀且常用于查询条件的列作为分桶列。可使用以下方法分析是否会导致数据倾斜： SELECT

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
beeline客户端报错“Failed to execute session hooks: over max connections” - MapReduce服务 MRS

more 原因分析业务量大导致连接HiveServer单个节点最大连接数超过了200，需要调大连接HiveServer实例的最大连接数。解决办法进入Hive服务配置页面： MRS 3.x之前版本，单击集群名称，登录集群详情页面，选择“组件管理 > Hive > 服务配置”，单击

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
通过JDBC方式实现查询HetuEngine SQL任务 - MapReduce服务 MRS

void init() throws ClassNotFoundException { // 认证用的密码写入代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全; // 本示例以密码保存在环境变量中来实现

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 开发HetuEngine应用 > HetuEngine样例程序（Java）
IoTDB性能调优 - MapReduce服务 MRS
IoTDB性能调优 - MapReduce服务 MRS

否则会导致IoTDB启动失败。查询场景调优举例：如果查询的范围比较大，单个序列10000个点以上，JVM分配内存的20% / 序列数 > 160K，即为默认配置下存储引擎对查询最友好的状态。序列和内存大小举例：500万序列，对应内存配置为：-Xms128G -Xmx128G write_read_sc

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB
schedule-tool工具使用指导 - MapReduce服务 MRS

format”一致。 yyyyMMdd file.format.iscompressed 待导入的文件是否为压缩文件。 false storage.type 存储类型。待导入文件最终保存的类型，分别有HDFS、HBase、Hive等。 HDFS schedule-tool工具支持同时配置多个作业。配置多个作业时，表2中“job

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
Spark客户端使用实践 - MapReduce服务 MRS

taken: 0.18 seconds, Fetched 1 row(s) 查看Spark应用运行结果。通过指定文件查看运行结果数据。结果数据的存储路径和格式由Spark应用程序指定。通过Web页面查看运行情况。登录Manager主页面。在服务中选择Spark2x。进入Spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
MRS集群用户权限模型 - MapReduce服务 MRS

权限策略中针对资源可配置各种访问条件，例如文件的读写，具体可以配置允许条件、拒绝条件以及例外条件等。权限机制 MRS集群采用LDAP存储用户和用户组的数据；角色的定义信息保存在关系数据库中，角色和权限的对应关系则保存在组件侧。 MRS使用Kerberos进行统一认证。用户权限校验流程大致如下：

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 集群用户权限概述
配置通过ELB访问Doris集群 - MapReduce服务 MRS

详细操作步骤请参考创建共享型负载均衡器。登录华为云管理控制台，在服务列表中选择“网络 > 弹性负载均衡 ELB”。在“负载均衡器”界面右上方单击“购买弹性负载均衡”。在“购买弹性负载均衡”界面，配置以下参数，其他参数保持默认即可：实例类型：选择“共享型”。计费模式：选择“按需计费”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris高可用功能

总条数： 2381

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Scala样例代码 - MapReduce服务 MRS

Hive CBO原理介绍 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

参考Hive JDBC代码用例开发的业务应用运行失败 - MapReduce服务 MRS

Spark CBO调优 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

开源sqoop-shell工具使用指导 - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HDFS - MapReduce服务 MRS

Flink作业大小表Join能力增强 - MapReduce服务 MRS

配置Spark动态脱敏 - MapReduce服务 MRS

schedule-tool工具使用指导 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

beeline客户端报错“Failed to execute session hooks: over max connections” - MapReduce服务 MRS

通过JDBC方式实现查询HetuEngine SQL任务 - MapReduce服务 MRS

IoTDB性能调优 - MapReduce服务 MRS

schedule-tool工具使用指导 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

MRS集群用户权限模型 - MapReduce服务 MRS

配置通过ELB访问Doris集群 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线