搜索_华为云

Phoenix SQL查询样例介绍 - MapReduce服务 MRS

directory</name> <value>[1]查询中间结果的临时目录</value> </property> JAVA样例：使用JDBC接口访问HBase public String getURL(Configuration conf) {

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > HBase应用开发常见问题
数据序列化 - MapReduce服务 MRS
数据序列化 - MapReduce服务 MRS

则会抛出异常。如果设置为false（默认值），Kryo会自动将未注册的类名写到对应的对象中。此操作会对系统性能造成影响。设置为true时，用户需手动注册类，针对未序列化的类，系统不会自动写入类名，而是抛出异常，相对比false，其性能较好。配置KryoSerializer作为数据序列化器和类注册器。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
运行SparkStreamingKafka样例工程时报“类不存在”问题 - MapReduce服务 MRS

t010/spark-streaming-kafka-0-10_2.12-3.1.1-hw-ei-311001-SNAPSHOT.jar 用户自己开发的应用程序以及样例工程都可使用上述命令提交。但是Spark开源社区提供的KafkaWordCount等样例程序，不仅需要添加--

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
Spark Core数据序列化 - MapReduce服务 MRS

则会发生异常。如果设置为false（默认值），Kryo会自动将未注册的类名写到对应的对象中。此操作会对系统性能造成影响。设置为true时，用户需手动注册类，针对未序列化的类，系统不会自动写入类名，而是发生异常，相对比false，其性能较好。配置KryoSerializer作为数据序列化器和类注册器。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
配置MRS集群弹性伸缩 - MapReduce服务 MRS

配置“节点类型”、“节点规格”、“节点数量”、“系统盘”，如开启“添加数据盘”后，还需要配置数据盘的存储类型、大小和数量。单击“确定”。弹性伸缩规则与资源计划叠加使用登录MRS管理控制台。选择“现有集群”，单击待操作的集群名称，进入集群详情页面。选择“弹性伸缩”页签，进入配置弹性伸缩界面。单击“新增弹

 帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
准备本地应用开发环境 - MapReduce服务 MRS

命周期。华为提供开源镜像站，各服务样例工程依赖的Jar包通过华为开源镜像站下载，剩余所依赖的开源Jar包请直接从Maven中央库或者其他用户自定义的仓库地址下载，详情请参考配置华为开源镜像仓。 7-zip 用于解压“*.zip”和“*.rar”文件，支持7-Zip 16.04版本。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > 准备Hive应用开发环境
HyperLogLog函数 - MapReduce服务 MRS
HyperLogLog函数 - MapReduce服务 MRS

询分区中所有元素的approx_distinct()，即每个元素出现的近似次数，进而通过很小的开销去完成整个查询。例如，只要计算每日每个用户浏览了多少次网页，就可以通过累加的方式，去计算每周、每年对应的数据，类似于通过汇总每日收入来计算每周收入。可以将approx_distinct()与GROUPING

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
查询作业列表信息 - MapReduce服务 MRS

tracking_url String 参数解释：日志链接地址。当前仅SparkSubmit作业支持该参数。该参数基于集群的EIP访问集群中的YARN WebUI页面，用户如果在VPC界面解绑EIP，MRS服务侧数据会因为未更新导致该参数引用旧EIP导致访问失败，可通过对集群重新进行EIP的绑定来修复该问题。

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 作业管理接口
配置进程参数 - MapReduce服务 MRS

onMaster主要负责container的启停。因而Driver和Executor的参数配置对spark应用的执行有着很大的影响意义。用户可通过如下操作对Spark集群性能做优化。操作步骤配置Driver内存。 Driver负责任务的调度，和Executor、AM之间的消

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Flink HA方案介绍 - MapReduce服务 MRS

中恢复。这里主要介绍Yarn模式下的HA方案。 Flink支持HA模式和Job的异常恢复。这两项功能高度依赖ZooKeeper，在使用之前用户需要在“flink-conf.yaml”配置文件中配置ZooKeeper，配置ZooKeeper的参数如下： high-availability:

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

命令执行后查看各个分组的数据条数是否相差不大，如果相差超过2/3或1/2，则需要重新选择分桶字段。 2千万以内数据禁止使用动态分区。动态分区会自动创建分区，而小表用户关注不到，会创建出大量不使用的分区分桶。创建表时，排序键key不能太多，一般建议3~5个；太多key会导致数据写入较慢，影响数据导入性能。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
Flink Job Pipeline样例程序（Scala） - MapReduce服务 MRS

val zkRegisterServerHandler = new ZookeeperRegisterServerHandler //添加用户自定义算子产生数据 env.addSource(new UserSource) .keyBy(0).map(x=>x.content

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Job Pipeline样例程序
Flink Job Pipeline样例程序（Scala） - MapReduce服务 MRS

val zkRegisterServerHandler = new ZookeeperRegisterServerHandler //添加用户自定义算子产生数据 env.addSource(new UserSource) .keyBy(0).map(x=>x.content

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Job Pipeline样例程序
为什么spark-beeline运行失败报“Failed to create ThriftService instance”的错误 - MapReduce服务 MRS

connection. 回答当网络不稳定时，会出现上述问题。当beeline出现timed-out异常时，Spark不会尝试重连。解决措施：用户需要通过重新启动spark-beeline进行重连。父主题： SQL和DataFrame

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
EXPLAIN - MapReduce服务 MRS
EXPLAIN - MapReduce服务 MRS

式进行分布。 BROADCAST Fragment会在固定数量的节点上执行，输入数据被广播到所有的节点。 SOURCE Fragment在访问输入分段的节点上执行。示例 LOGICAL： CREATE TABLE testTable (regionkey int, name varchar);

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine辅助命令语法
HDFS基本原理 - MapReduce服务 MRS
HDFS基本原理 - MapReduce服务 MRS

HttpFS是个单独无状态的gateway进程，对外提供webHDFS接口，对HDFS使用FileSystem接口对接。可用于不同Hadoop版本间的数据传输，及用于访问在防火墙后的HDFS（HttpFS用作gateway）。 HDFS HA架构 HA即为High Availability，用于解决Name

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
Loader算子数据处理规则 - MapReduce服务 MRS

配置输入字段列数，大于原始数据实际包含的字段列数，全部数据成为脏数据。遇到类型转换错误，当前数据保存为脏数据。空值转换原始数据包含NULL值，转换为用户指定的值。配置输入字段列数，大于原始数据实际包含的字段列数，全部数据成为脏数据。随机值转换不涉及处理NULL值、空字符串，不生成脏数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助
在本地Windows环境中调测HDFS程序 - MapReduce服务 MRS

域名（Default Realm，从环境变量USERDNSDOMAIN中获取）。如果该主机没有域名，则运行样例程序会有如下报错：此时需要用户设置系统的环境变量USERDNSDOMAIN以规避该问题，具体如下：单击“计算机”右键，选择“属性”，然后选择“高级系统设置 > 高级 >

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 调测HDFS应用
在Linux环境中调测Doris应用 - MapReduce服务 MRS

example.JDBCExample.main(JDBCExample.java:71) Doris对接SpringBoot运行结果在浏览器中访问链接“http://样例运行节点IP地址:8080/doris/example/executesql”，IDEA正常打印日志，请求返回如下图所示：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Doris开发指南（安全模式） > 调测Doris应用

总条数： 2879

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Phoenix SQL查询样例介绍 - MapReduce服务 MRS

数据序列化 - MapReduce服务 MRS

运行SparkStreamingKafka样例工程时报“类不存在”问题 - MapReduce服务 MRS

Spark Core数据序列化 - MapReduce服务 MRS

配置MRS集群弹性伸缩 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

HyperLogLog函数 - MapReduce服务 MRS

查询作业列表信息 - MapReduce服务 MRS

配置进程参数 - MapReduce服务 MRS

Flink HA方案介绍 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

Flink Job Pipeline样例程序（Scala） - MapReduce服务 MRS

Flink Job Pipeline样例程序（Scala） - MapReduce服务 MRS

为什么spark-beeline运行失败报“Failed to create ThriftService instance”的错误 - MapReduce服务 MRS

EXPLAIN - MapReduce服务 MRS

HDFS基本原理 - MapReduce服务 MRS

Loader算子数据处理规则 - MapReduce服务 MRS

在本地Windows环境中调测HDFS程序 - MapReduce服务 MRS

在Linux环境中调测Doris应用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线