搜索_华为云

加载数据到Hive表中 - MapReduce服务 MRS

加载数据到Hive表中功能介绍本小节介绍了如何使用HQL向已有的表employees_info中加载数据。从本节中可以掌握如何从本地文件系统、MRS集群中加载数据。以关键字LOCAL区分数据源是否来自本地。在启用了安全服务的集群中执行如下操作，需要在数据库中具有UPDATE

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 开发Hive应用 > Hive JDBC访问样例程序
建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率操作场景 Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤 MRS 3.x之前版本：登录MRS控制台，在左侧导航栏选择“现有集群”，单击集群名称。选择“节点管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
创建Phoenix表 - MapReduce服务 MRS
创建Phoenix表 - MapReduce服务 MRS

创建Phoenix表功能简介 Phoenix依赖HBase作为其后备存储，支持标准SQL和JDBC API的强大功能，使得SQL用户可以访问HBase集群。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“PhoenixSampl

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写示例程序
集群添加组件 - MapReduce服务 MRS

集群添加组件，仅MRS 3.1.2及之后普通版本和MRS 3.1.2-LTS.2及之后的LTS版本的自定义集群支持添加组件功能。调用方法请参见如何调用API。 URI POST /v2/{project_id}/clusters/{cluster_id}/components 表1 路径参数

 帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
Hive输入 - MapReduce服务 MRS
Hive输入 - MapReduce服务 MRS

配置的长度截取，“类型”为“CHAR”时实际长度不足则空格补齐，“类型”为“VARCHAR”时实际长度不足则不补齐。 map 是 - 数据处理规则当配置Hive表名不存在时，作业提交失败。当配置的列名与Hive表列名不匹配时，读取不到数据，导入数据条数会为0。当字段的值与实

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输入算子
Spark输入 - MapReduce服务 MRS
Spark输入 - MapReduce服务 MRS

配置的长度截取，“类型”为“CHAR”时实际长度不足则空格补齐，“类型”为“VARCHAR”时实际长度不足则不补齐。 map 是 - 数据处理规则当配置SparkSQL表名不存在时，作业提交失败。当配置的列名与SparkSQL表列名不匹配时，读取不到数据，导入数据条数会为0。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输入算子
使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

在MRS服务中可以配合Jupyter Notebook使用PySpark，能够提高机器学习、数据探索和ETL应用开发效率。本实践指导用户如何在MRS集群中配置Jupyter Notebook来使用Pyspark。方案架构 Spark的应用运行架构如图1所示，运行流程如下所示：

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
ClickHouse宽表设计原则 - MapReduce服务 MRS

在大部分场景下，有大表两表join以及多表join的场景，且多个join的表数据变化更新频率较低，这种情况，建议对多个表join查询逻辑提前进行加工处理，将处理后的数据写入到一个宽表中，宽表中包含所有要查询的数据字段，以供后续应用完全自助OLAP的高性能查询。表命名规范数据库表名称命名规则：

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
Storm性能调优 - MapReduce服务 MRS
Storm性能调优 - MapReduce服务 MRS

当需要提升Storm数据量处理性能时，可以通过拓扑调优的操作提高效率。建议在可靠性要求不高的场景下进行优化。表1 调优参数配置参数默认值调优场景 topology.acker.executors null Acker的执行器数量。当业务应用对可靠性要求较低，允许不处理部分数据，可设置

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm > 性能调优
Hive输入 - MapReduce服务 MRS
Hive输入 - MapReduce服务 MRS

配置的长度截取，“类型”为“CHAR”时实际长度不足则空格补齐，“类型”为“VARCHAR”时实际长度不足则不补齐。 map 是 - 数据处理规则当配置Hive表名不存在时，作业提交失败。当配置的列名与Hive表列名不匹配时，读取不到数据，导入数据条数会为0。当字段的值与实

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
Spark输入 - MapReduce服务 MRS
Spark输入 - MapReduce服务 MRS

配置的长度截取，“类型”为“CHAR”时实际长度不足则空格补齐，“类型”为“VARCHAR”时实际长度不足则不补齐。 map 是 - 数据处理规则当配置SparkSQL表名不存在时，作业提交失败。当配置的列名与SparkSQL表列名不匹配时，读取不到数据，导入数据条数会为0。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
SET/RESET - MapReduce服务 MRS
SET/RESET - MapReduce服务 MRS

e）。有关详细信息，请参阅•Bad Records处理： carbon.options.is.empty.data.bad.record 指定空数据是否被视为bad record。有关详细信息，请参阅 Bad Records处理： carbon.options.sort.scope

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
ClickHouse SQL调优 - MapReduce服务 MRS

ClickHouse SQL调优规则合理使用数据表的分区字段和索引字段。 MergeTree引擎，数据是以分区目录的形式进行组织存储的，在进行的数据查询时，使用分区可以有效跳过无用的数据文件，减少数据的读取。 MergeTree引擎会根据索引字段进行数据排序，并且根据inde

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库调优
SET/RESET - MapReduce服务 MRS
SET/RESET - MapReduce服务 MRS

e）。有关详细信息，请参阅•Bad Records处理： carbon.options.is.empty.data.bad.record 指定空数据是否被视为bad record。有关详细信息，请参阅 Bad Records处理： carbon.options.sort.scope

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
配置MapReduce Job基线 - MapReduce服务 MRS

以便每个节点都有任务处理。原则三：每个task的执行时间要合理。如果一个job，每个map或reduce的执行时间只有几秒钟，就意味着这个job的大部分时间都消耗在task的调度和进程启停阶段，因此需要增加每个task处理的数据大小。建议一个task处理时间为1分钟。控制单

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
流式写入Hudi表 - MapReduce服务 MRS

TransformerExample // 指定如何处理数据源拉取来的数据，可根据自身业务需求做定制 --enable-hive-sync // 开启hive同步，同步hudi表到hive --continuous // 指定流处理模式为连续模式父主题： Hudi写操作

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
ClickHouse日志管理规则 - MapReduce服务 MRS

ClickHouse日志管理规则日志路径 ClickHouse相关日志的默认存储路径为：“${BIGDATA_LOG_HOME}/clickhouse”。 ClickHouseServer运行相关日志：“/var/log/Bigdata/clickhouse/clickhouseServer/

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库运维
加载数据到Hive表中 - MapReduce服务 MRS

加载数据到Hive表中功能介绍本小节介绍了如何使用HQL向已有的表employees_info中加载数据。从本节中可以掌握如何从本地文件系统、MRS集群中加载数据。以关键字LOCAL区分数据源是否来自本地。在启用了安全服务的集群中执行如下操作，需要在数据库中具有UPDATE

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 开发Hive应用 > Hive JDBC访问样例程序
IoTDB自定义函数（UDF）样例程序 - MapReduce服务 MRS

IoTDB自定义函数（UDF）样例程序功能简介该样例代码介绍如何实现一个简单的IoTDB自定义函数（UDF）。详细信息可以参考UDF样例程序与操作章节。代码样例以下为代码片段示例： package com.huawei.bigdata.iotdb; import org

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（普通模式） > 开发IoTDB应用
IoTDB自定义函数（UDF）样例程序 - MapReduce服务 MRS

IoTDB自定义函数（UDF）样例程序功能简介该样例代码介绍如何实现一个简单的IoTDB自定义函数（UDF）。详细信息可以参考UDF样例程序与操作章节。代码样例以下为代码片段示例： package com.huawei.bigdata.iotdb; import org

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（安全模式） > 开发IoTDB应用

总条数： 2980

上一页
1
...
84
85
86
...
149
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

加载数据到Hive表中 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

创建Phoenix表 - MapReduce服务 MRS

集群添加组件 - MapReduce服务 MRS

Hive输入 - MapReduce服务 MRS

Spark输入 - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

ClickHouse宽表设计原则 - MapReduce服务 MRS

Storm性能调优 - MapReduce服务 MRS

Hive输入 - MapReduce服务 MRS

Spark输入 - MapReduce服务 MRS

SET/RESET - MapReduce服务 MRS

ClickHouse SQL调优 - MapReduce服务 MRS

SET/RESET - MapReduce服务 MRS

配置MapReduce Job基线 - MapReduce服务 MRS

流式写入Hudi表 - MapReduce服务 MRS

ClickHouse日志管理规则 - MapReduce服务 MRS

加载数据到Hive表中 - MapReduce服务 MRS

IoTDB自定义函数（UDF）样例程序 - MapReduce服务 MRS

IoTDB自定义函数（UDF）样例程序 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线