搜索_华为云

Hudi表概述 - MapReduce服务 MRS
Hudi表概述 - MapReduce服务 MRS

system”，即可查看Hudi表。 “.hoodie”文件夹中存放了对应的文件合并操作相关的日志文件。包含_partition_key相关的路径是实际的数据文件和metadata，按分区存储。 Hudi的数据文件使用Parquet文件格式的base file和Avro格式的log file存储。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
初始化HDFS - MapReduce服务 MRS
初始化HDFS - MapReduce服务 MRS

加载HDFS服务配置文件，并进行kerberos安全认证。认证通过后，实例化Filesystem。使用HDFS的API。此处kerberos安全认证需要使用到的keytab文件，请提前准备。配置文件介绍登录HDFS时会使用到如表1所示的配置文件。这些文件均已导入到“hdf

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 开发HDFS应用
向动态分区表中插入数据时，在重试的task中出现"Failed to CREATE - MapReduce服务 MRS

1.6 回答动态分区表插入数据的最后一步是读取shuffle文件的数据，再写入到表对应的分区文件中。当大面积shuffle文件损坏后，会引起大批量task失败，然后进行job重试。重试前Spark会将写表分区文件的句柄关闭，大批量task关闭句柄时HDFS无法及时处理。在ta

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
运行SparkSubmit作业 - MapReduce服务 MRS

设置任务的主类名，由用户程序内的函数指定。 org.apache.spark.examples.SparkPi --files 上传文件给作业任务，可以是自己定义的配置文件或者某些数据文件，来源可以是OBS或者HDFS。 - --jars 上传任务额外依赖的jar，通常用于给任务添加外部依赖包。 -

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
HDFS Shell命令介绍 - MapReduce服务 MRS

HDFS Shell命令介绍 HDFS Shell 您可以使用HDFS Shell命令对HDFS文件系统进行操作，例如读文件、写文件等操作。执行HDFS Shell的方法：初始化环境变量。 source /opt/client/bigdata_env 如果当前集群已启用Ker

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > HDFS应用开发常见问题
Flink常用配置参数 - MapReduce服务 MRS

fs.overwrite-files 文件输出写操作是否默认覆盖已有文件。 false 否 fs.output.always-create-directory 当文件写入程序的并行度大于1时，输出文件的路径下会创建一个目录，并将不同的结果文件（每个并行写程序任务）放入该目录。设

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink运维管理
Flink HBase样例程序开发思路 - MapReduce服务 MRS

本样例介绍通过Flink API作业读写HBase数据。数据规划准备HBase配置文件，通过Manager下载集群配置，获取“hbase-site.xml”文件。开发思路写HBase：通过参数指定“hbase-site.xml”文件的父目录，Flink Sink可以获取到HBase的Connection。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink读取HBase表样例程序
使用Python提交Flink普通作业 - MapReduce服务 MRS

zip”文件。 zip -q -r venv.zip venv/ 以root用户登录主管理节点，将1和2获取的“venv.zip”、“pyflink-kafka.py”和“insertData2kafka.sql”文件上传至客户端环境。 per-job模式：将上述文件上传到“客

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > PyFlink样例程序
准备ClickHouse应用运行环境 - MapReduce服务 MRS

tar”，继续解压该文件。复制解压目录下的“hosts”文件中的内容到本地hosts文件中。在应用开发过程中，如需在本地Windows系统中调测应用程序，需要确保本地节点能与“hosts”文件中所列出的各主机在网络上互通。 Windows本地hosts文件存放路径举例：“C:

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（普通模式） > 准备ClickHouse应用开发环境
Flink常用配置参数 - MapReduce服务 MRS

fs.overwrite-files 文件输出写操作是否默认覆盖已有文件。 false 否 fs.output.always-create-directory 当文件写入程序的并行度大于1时，输出文件的路径下会创建一个目录，并将不同的结果文件（每个并行写程序任务）放入该目录。设

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink运维管理
添加GAUSSDB数据源 - MapReduce服务 MRS

数据源所在集群与HetuEngine集群节点网络互通。在HetuEngine所在集群的所有节点的“/etc/hosts”文件中，添加待对接数据源所在集群的主机名称和对应的IP映射，及其“/etc/hosts”文件中的“10.10.10.10 hadoop.系统域名”（如“10.10.10.10 hadoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
配置HDFS Mover命令迁移数据 - MapReduce服务 MRS

据存储策略，将集群中的数据重新分布。通过运行Mover，周期性地检测HDFS文件系统中用户指定的HDFS文件或目录，判断该文件或目录是否满足设置的存储策略，如果不满足，则进行数据迁移，使目标目录或文件满足设定的存储策略。本章节适用于MRS 3.x及后续版本。配置描述请参考

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
使用Spark客户端创建CarbonData表 - MapReduce服务 MRS

table之后，可以从CSV文件加载数据到所创建的table中。在CarbonData中查询数据创建CarbonData table并加载数据之后，可以执行所需的查询操作，例如filters，groupby等。准备CSV文件在本地准备CSV文件，文件名为：test.csv，样例如下：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本）
使用Python提交Flink普通作业 - MapReduce服务 MRS

zip”文件。 zip -q -r venv.zip venv/ 以root用户登录主管理节点，将1和2获取的“venv.zip”、“pyflink-kafka.py”和“insertData2kafka.sql”文件上传至客户端环境。 per-job模式：将上述文件上传到“客

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > PyFlink样例程序
配置HDFS通过Guardian访问OBS - MapReduce服务 MRS

在HDFS命令行显式添加要访问的OBS文件系统。例如：使用以下命令访问OBS文件系统。 hdfs dfs -ls obs://OBS并行文件系统名称/路径使用以下命令创建OBS文件系统下的目录： hdfs dfs -mkdir obs://OBS并行文件系统名称/hadoop 使用以

 帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过Guardian对接OBS > MRS集群服务对接OBS示例
使用Spark客户端创建CarbonData表 - MapReduce服务 MRS

table之后，可以从CSV文件加载数据到所创建的table中。在CarbonData中查询数据创建CarbonData table并加载数据之后，可以执行所需的查询操作，例如filters，groupby等。准备CSV文件在本地准备CSV文件，文件名为：test.csv，样例如下：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData
Flink任务开发建议 - MapReduce服务 MRS

RocksDBStateBackend 方式 Checkpoint数据直接返回给Master节点，不落盘数据写入文件，将文件路径传给Master 数据写入文件，将文件路径传给Master 存储堆内存堆内存 Rocksdb（本地磁盘）性能相比最好（一般不用）性能好性能不好

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink任务开发规范
如何使用IBM JDK连接ZooKeeper - MapReduce服务 MRS

Keeper失败。回答可能原因为IBM的JDK和普通JDK的jaas.conf文件格式不一样。在使用IBM JDK时，建议使用如下jaas.conf文件模板，其中“useKeytab”中的文件路径必须以“file://”开头，后面为绝对路径。 Client { com.ibm

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ZooKeeper > ZooKeeper常见问题
概述 - MapReduce服务 MRS
概述 - MapReduce服务 MRS

“数据导出”章节适用于MRS 3.x及后续版本。简介 Loader是实现MRS与关系型数据库、文件系统之间交换数据和文件的ETL工具，支持将数据或者文件从MRS系统中导出到关系型数据库或文件系统中。 Loader支持如下数据导出方式：从HDFS/OBS中导出数据到SFTP服务器

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
IoTDB应用开发规则 - MapReduce服务 MRS

设置合理数量的存储组可以带来性能的提升。既不会因为产生过多的存储文件（夹）导致频繁切换IO降低系统速度（并且会占用大量内存且出现频繁的内存-文件切换），也不会因为过少的存储文件夹（降低了并发度从而）导致写入命令阻塞。应根据自己的数据规模和使用场景，平衡存储文件的存储组设置，以达到更好的系统性能。所有

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > IoTDB应用开发规范

总条数： 3113

上一页
1
...
17
18
19
...
156
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表概述 - MapReduce服务 MRS

初始化HDFS - MapReduce服务 MRS

向动态分区表中插入数据时，在重试的task中出现"Failed to CREATE - MapReduce服务 MRS

运行SparkSubmit作业 - MapReduce服务 MRS

HDFS Shell命令介绍 - MapReduce服务 MRS

Flink常用配置参数 - MapReduce服务 MRS

Flink HBase样例程序开发思路 - MapReduce服务 MRS

使用Python提交Flink普通作业 - MapReduce服务 MRS

准备ClickHouse应用运行环境 - MapReduce服务 MRS

Flink常用配置参数 - MapReduce服务 MRS

添加GAUSSDB数据源 - MapReduce服务 MRS

配置HDFS Mover命令迁移数据 - MapReduce服务 MRS

使用Spark客户端创建CarbonData表 - MapReduce服务 MRS

使用Python提交Flink普通作业 - MapReduce服务 MRS

配置HDFS通过Guardian访问OBS - MapReduce服务 MRS

使用Spark客户端创建CarbonData表 - MapReduce服务 MRS

Flink任务开发建议 - MapReduce服务 MRS

如何使用IBM JDK连接ZooKeeper - MapReduce服务 MRS

概述 - MapReduce服务 MRS

IoTDB应用开发规则 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线