搜索_华为云

Loader使用简介 - MapReduce服务 MRS

单击“新建连接”，进入配置页面，并填写参数创建一个Loader连接。 Loader作业介绍 Loader作业用于管理数据迁移任务，每个作业包含一个源数据的连接，和一个目的数据的连接，通过从源连接读取数据，再将数据保存到目的连接，完成数据迁移任务。父主题：使用Loader

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
ClickHouse应用程序开发思路 - MapReduce服务 MRS

建立连接：建立和ClickHouse服务实例的连接。创建库：创建ClickHouse数据库。创建表：创建ClickHouse数据库下的表。插入数据：插入数据到ClickHouse表中。查询数据：查询ClickHouse表数据。删除表：删除已创建的ClickHouse表。父主题：开发ClickHouse应用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（普通模式） > 开发ClickHouse应用
分布式Scan HBase表 - MapReduce服务 MRS

用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。使用特定的规则扫描Hbase表。打包项目

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
分布式Scan HBase表 - MapReduce服务 MRS

用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。使用特定的规则扫描Hbase表。打包项目

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
创建CDL作业前准备 - MapReduce服务 MRS

创建CDL作业前准备开启Kafka高可靠功能登录CDLService WebUI界面上传数据库驱动文件创建CDL数据库连接管理CDL ENV变量配置源数据心跳表实现数据判齐功能父主题：使用CDL

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL
Kafka常用配置参数 - MapReduce服务 MRS

Offset提交时被延迟处理的最大超时时间。 replica.socket.timeout.ms 副本数据同步请求的超时时间，配置值不得小于replica.fetch.wait.max.ms。单位：毫秒。 30000 同步线程在发送同步请求之前等待通道建立的最大超时时间，要求配置大于replica.fetch

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka运维管理
长整型时间转换 - MapReduce服务 MRS

配置时间字段格式，时间格式如：“yyyyMMdd HH:mm:ss”。 string 否无数据处理规则原始数据包含null值，不做转换处理。配置输入字段列数，大于原始数据实际包含字段列数，全部数据成为脏数据。遇到类型转换错误，当前数据保存为脏数据。样例通过“CSV文件输入”算子，生成两个字段A和B。源文件如下图：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 转换算子
长整型时间转换 - MapReduce服务 MRS

配置时间字段格式，时间格式如：“yyyyMMdd HH:mm:ss”。 string 否无数据处理规则原始数据包含null值，不做转换处理。配置输入字段列数，大于原始数据实际包含字段列数，全部数据成为脏数据。遇到类型转换错误，当前数据保存为脏数据。样例通过“CSV文件输入”算子，生成两个字段A和B。源文件如下图：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader转换类算子
CSV文件输入 - MapReduce服务 MRS
CSV文件输入 - MapReduce服务 MRS

际长度不足则不补齐。 map 是无数据处理规则将每行数据按照指定的分隔符，分隔成多个字段，供之后的转换算子使用。当字段的值与实际的类型不匹配时，该行数据会成为脏数据。输入字段列数不等于原始数据实际包含字段列数，该行数据会保存为脏数据。样例源文件如下图：配置“CSV文件输入”算子，分隔符为“

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
mapPartition接口使用 - MapReduce服务 MRS

tion接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造需要遍历的HBase表中rowkey的RDD。使用mapPartition接口遍历上述rowkey对应的数据信息，并进行简单的操作。打包项目

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
INSERT INTO CARBON TABLE - MapReduce服务 MRS

t表）。注意事项表必须已经存在。用户应属于数据加载组以执行数据加载操作。默认情况下，数据加载组被命名为“ficommon”。 CarbonData表不支持Overwrite。源表和目标表的数据类型应该相同，否则源表中的数据将被视为Bad Records。 INSERT I

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
Quantile digest函数 - MapReduce服务 MRS

Quantile digest（分位数摘要）是存储近似百分位信息的数据草图。HetuEngine中用qdigest表示这种数据结构。函数 merge(qdigest) → qdigest 描述：将所有输入的qdigest数据合并成一个qdigest。 value_at_quantile(qdigest(T)

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Flink DataStream样例程序开发思路 - MapReduce服务 MRS

female,50 FangBo,female,60 数据规划 DataStream样例工程的数据存储在文本中。将log1.txt和log2.txt放置在指定路径下，例如"/opt/log1.txt"和"/opt/log2.txt"。数据文件若存放在本地文件系统，需在所有部署Yarn

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink DataStream样例程序
Flink DataStream样例程序开发思路 - MapReduce服务 MRS

female,50 FangBo,female,60 数据规划 DataStream样例工程的数据存储在文本中。将log1.txt和log2.txt放置在指定路径下，例如"/opt/log1.txt"和"/opt/log2.txt"。数据文件若存放在本地文件系统，需在所有部署Yarn

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink DataStream样例程序
Flink DataStream样例程序开发思路 - MapReduce服务 MRS

female,50 FangBo,female,60 数据规划 DataStream样例工程的数据存储在文本中。将log1.txt和log2.txt放置在指定路径下，例如"/opt/log1.txt"和"/opt/log2.txt"。数据文件若存放在本地文件系统，需在所有部署Yarn

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink DataStream样例程序
Flink Job Pipeline增强 - MapReduce服务 MRS

整个流图。拆分成多个作业目前还存在问题。通常情况下，作业之间可以通过Kafka实现数据传输，如作业A可以将数据发送到Kafka的Topic A下，然后作业B和作业C可以从Topic A下读取数据。该方案简单易行，但是延迟一般大于100ms。采用TCP直接相连的方式，算子在分

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
配置SparkSQL的分块个数 - MapReduce服务 MRS

配置SparkSQL的分块个数配置场景 SparkSQL在进行shuffle操作时默认的分块数为200。在数据量特别大的场景下，使用默认的分块数就会造成单个数据块过大。如果一个任务产生的单个shuffle数据块大于2G，该数据块在被fetch的时候还会报类似错误： Adjusted frame length

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
Hive基本原理 - MapReduce服务 MRS
Hive基本原理 - MapReduce服务 MRS

Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言，称为HQL，它允许熟悉SQL的用户查询数据。Hive的数据计算依赖于MapReduce、Spark、Tez。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
创建HBase权限角色 - MapReduce服务 MRS

e表和列族的读（R）、写（W）、创建（C）、执行（X）或管理（A）权限。用户需要在HBase中对指定的数据库或表设置权限，才能够创建表、查询数据、删除数据、插入数据、更新数据以及授权他人访问HBase表。仅开启了Kerberos认证的集群（安全模式）支持创建HBase角色。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

Time的聚合计算，支持对迟到数据的处理。支持对流式数据的去除重复数据操作。支持状态计算。支持对流处理任务的监控。支持批流join，流流join。当前JOIN操作支持列表如下：左表右表支持的Join类型说明 Static Static 全部类型即使在流处理中，不涉及流数据的join操作也能全部支持

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题

总条数： 4006

上一页
1
...
96
97
98
...
201
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Loader使用简介 - MapReduce服务 MRS

ClickHouse应用程序开发思路 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

创建CDL作业前准备 - MapReduce服务 MRS

Kafka常用配置参数 - MapReduce服务 MRS

长整型时间转换 - MapReduce服务 MRS

长整型时间转换 - MapReduce服务 MRS

CSV文件输入 - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

INSERT INTO CARBON TABLE - MapReduce服务 MRS

Quantile digest函数 - MapReduce服务 MRS

Flink DataStream样例程序开发思路 - MapReduce服务 MRS

Flink DataStream样例程序开发思路 - MapReduce服务 MRS

Flink DataStream样例程序开发思路 - MapReduce服务 MRS

Flink Job Pipeline增强 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

Hive基本原理 - MapReduce服务 MRS

创建HBase权限角色 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线