搜索_华为云

创建Hive用户自定义函数 - MapReduce服务 MRS

用户定义聚集函数UDAF（User-Defined Aggregating Functions），用于接受多个输入数据行，并产生一个输出数据行。用户定义表生成函数UDTF（User-Defined Table-Generating Functions），用于操作单个输入行，产生多个输出行。按使用方法，UDF有如下分类：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

"）内。例如："a\b"。 Bad Records处理：为了使数据处理应用程序为用户增值，不可避免地需要对数据进行某种程度的集成。在大多数情况下，数据质量问题源于生成源数据的上游（主要）系统。有两种完全不同的方式处理Bad Data：按照原始数据加载所有数据，之后进行除错处理。在进入数据源的过程中，可以清理或擦除Bad

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

rowsPerSecond：每秒产生的行数，默认值1 rampUpTime：在达到rowsPerSecond速度之前的上升时间 numPartitions：生成数据行的并行度支持 - Kafka Source 参见https://archive.apache.org/dist/spark/docs/3

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

rowsPerSecond：每秒产生的行数，默认值1 rampUpTime：在达到rowsPerSecond速度之前的上升时间 numPartitions：生成数据行的并行度支持 - Kafka Source 参见https://archive.apache.org/dist/spark/docs/3

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

rowsPerSecond：每秒产生的行数，默认值1 rampUpTime：在达到rowsPerSecond速度之前的上升时间 numPartitions：生成数据行的并行度支持 - Kafka Source 参见https://archive.apache.org/dist/spark/docs/3

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
备份ClickHouse元数据 - MapReduce服务 MRS

”，根据待安装客户端节点的节点类型选择正确的平台类型后（x86选择x86_64，ARM选择aarch64）单击“确定”。等待客户端文件包生成后根据浏览器提示下载客户端到本地并解压。例如，客户端文件压缩包为“FusionInsight_Cluster_1_HDFS_Client

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 备份MRS集群组件数据
典型场景：从SFTP服务器导入数据到Hive - MapReduce服务 MRS

可分割至多个map，数据保存至输出目录时保存的文件数与map数量相同，文件名格式为“import_part_xxxx”，“xxxx”为系统生成的随机数，具有唯一性。 FILE 过滤器类型选择文件过滤的条件，与“路径过滤器”、“文件过滤器”配合使用。选择“WILDCARD”，表示使用通配符过滤。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
Json函数和运算符 - MapReduce服务 MRS

NULL到JSON的转换并不能简单地实现。从独立的NULL进行转换将产生一个SQLNULL，而不是JSON 'null'。不过，在从包含NULL的数组或Map进行转换时，生成的JSON将包含NULL。在从ROW转换为JSON时，结果是一个JSON数组，而不是一个JSON对象。这是因为对于SQL中的行，位置比名称更重要。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
HetuEngine日志介绍 - MapReduce服务 MRS

日志归档规则采用FixedWindowRollingPolicy策略，可配置项为单个文件最大值、日志归档的最大保留数目，具体规则如下：当单个文件超过默认单个文件最大值时，就会生成一个新的归档压缩文件，归档后的日志压缩文件命名规则为<原有日志名>.[编号].log.gz。日志删除规则：运行日志中的HetuEngi

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
缩容MRS集群 - MapReduce服务 MRS
缩容MRS集群 - MapReduce服务 MRS

执行缩容操作。原因：确保缩容后剩余空间足够存放现有数据，并预留一部分空间。说明：为了保证数据的可靠性，HDFS中每保存一个文件则自动生成1个备份文件，即默认共2个副本。 HBase/RegionServer 规则：除缩容节点外，其他节点RegionServer剩余可用内存的

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
准备连接HBase集群配置文件 - MapReduce服务 MRS

”，根据待安装客户端节点的节点类型选择正确的平台类型后（x86选择x86_64，ARM选择aarch64），单击“确定”，等待客户端文件包生成后根据浏览器提示下载客户端到本地并解压。例如，客户端配置文件压缩包为“FusionInsight_Cluster_1_Services_Client

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 准备HBase应用开发环境
在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

打包成功之后，在工程根目录的“target”子目录下获取打好的jar包，例如“MRTest-XXX.jar”，jar包名称以实际打包结果为准。上传生成的应用包“MRTest-XXX.jar”到Linux客户端上，例如“/opt/client/conf”，与配置文件位于同一目录下。在Linux环境下运行样例工程。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式） > 调测MapReduce应用
快速开发Hive HCatalog应用 - MapReduce服务 MRS

选择package生命周期，执行Maven构建过程。图2 打包样例程序当输出“BUILD SUCCESS”，表示编译成功。编译成功后将会在样例工程的“target”目录下生成jar包“hcatalog-example-XXX.jar”。 [INFO] ------------------------------

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

"）内。例如："a\b"。 Bad Records处理：为了使数据处理应用程序为用户增值，不可避免地需要对数据进行某种程度的集成。在大多数情况下，数据质量问题源于生成源数据的上游（主要）系统。有两种完全不同的方式处理Bad Data：按照原始数据加载所有数据，之后进行除错处理。在进入数据源的过程中，可以清理或擦除Bad

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
使用Loader从SFTP服务器导入数据到Hive - MapReduce服务 MRS

可分割至多个map，数据保存至输出目录时保存的文件数与map数量相同，文件名格式为“import_part_xxxx”，“xxxx”为系统生成的随机数，具有唯一性。 FILE 过滤器类型选择文件过滤的条件，与“路径过滤器”、“文件过滤器”配合使用。选择“WILDCARD”，表示使用通配符过滤。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
使用Loader从HDFS导出数据到ClickHouse - MapReduce服务 MRS

可分割至多个map，数据保存至输出目录时保存的文件数与map数量相同，文件名格式为“import_part_xxxx”，“xxxx”为系统生成的随机数，具有唯一性。 FILE Map数配置数据操作的MapReduce任务中同时启动的Map数量。不可与“Map数据块大小”同时配置。参数值必须小于或等于3000。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
批量写入Hudi表 - MapReduce服务 MRS

在确定数据都为新数据时建议使用INSERT，当存在更新数据时建议使用UPSERT，当初始化数据集时建议使用BULK_INSERT。批量写入Hudi表引入Hudi包生成测试数据，参考使用Spark Shell创建Hudi表章节的2到4。写入Hudi表，写入命令中加入参数：option("hoodie.datasource

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
准备本地应用开发环境 - MapReduce服务 MRS

件”，根据待安装客户端节点的节点类型选择正确的平台类型后（x86选择x86_64，ARM选择aarch64）单击“确定”，等待客户端文件包生成后根据浏览器提示下载客户端到本地并解压。例如，客户端文件压缩包为“FusionInsight_Cluster_1_Services_Client

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

打包成功之后，在工程根目录的“target”子目录下获取打好的jar包，例如“MRTest-XXX.jar”，jar包名称以实际打包结果为准。上传生成的应用包“MRTest-XXX.jar”到Linux客户端上，例如“/opt/client/conf”，与配置文件位于同一目录下。在Linux环境下运行样例工程。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（安全模式） > 调测MapReduce应用
快速开发HBase应用 - MapReduce服务 MRS

conf”文件。选择“集群 > 概览 > 更多 > 下载客户端”，“选择客户端类型”设置为“仅配置文件”，单击“确定”，等待客户端文件包生成后根据浏览器提示下载客户端到本地并解压。例如，客户端配置文件压缩包为“FusionInsight_Cluster_1_Services_Client

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用

总条数： 1011

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Hive用户自定义函数 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

备份ClickHouse元数据 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到Hive - MapReduce服务 MRS

Json函数和运算符 - MapReduce服务 MRS

HetuEngine日志介绍 - MapReduce服务 MRS

缩容MRS集群 - MapReduce服务 MRS

准备连接HBase集群配置文件 - MapReduce服务 MRS

在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

快速开发Hive HCatalog应用 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到Hive - MapReduce服务 MRS

使用Loader从HDFS导出数据到ClickHouse - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

快速开发HBase应用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线