搜索_华为云

配置ModelArts和SFS Turbo间网络直通 - 对象存储服务 OBS

Turbo后，可直接在ModelArts的Notebook开发及训练环境中挂载SFS Turbo共享文件系统，并访问其中的数据。登录ModelArts管理控制台，创建网络并打通创建资源中创建的创建虚拟私有云和子网，详细步骤参见ModelArts网络。单击1中创建生成的资源池“网络”所在行的“更多”，选择“关联sfsturbo”。

帮助中心 > 对象存储服务 OBS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 基本配置
配置SFS Turbo数据自动导出到OBS桶 - 对象存储服务 OBS

Turbo文件系统的Checkpoint模型文件会自动以异步方式导出到关联的OBS桶中进行长期保存，无需手工导出，异步导出方式不会占用上层训练任务时间。 SFS Turbo的自动导出功能当前处于受限使用状态，请提交工单联系技术支持人员进行配置。文件导出速度受OBS服务的写入带宽上限影

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 基本配置
对接大数据组件 - 对象存储服务 OBS

对接大数据组件支持的大数据组件简介 Hadoop对接OBS Hive对接OBS Spark对接OBS Presto对接OBS Flume对接OBS DataX对接OBS Druid对接OBS Flink对接OBS Logstash对接OBS 父主题：大数据场景下使用OBS实现存算分离

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离
华为云MRS对接OBS - 对象存储服务 OBS

华为云MRS对接OBS 对接步骤配置存算分离集群。详细操作，请参见使用委托方式配置存算分离集群。使用存算分离集群。详细操作，请参见使用存算分离集群。父主题：对接大数据平台

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据平台
对接大数据平台 - 对象存储服务 OBS

对接大数据平台支持的大数据平台简介华为云MRS对接OBS Cloudera CDH对接OBS Hortonworks HDP对接OBS 父主题：大数据场景下使用OBS实现存算分离

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离
DataX对接OBS - 对象存储服务 OBS
DataX对接OBS - 对象存储服务 OBS

Server、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS等各种异构数据源之间高效的数据同步功能。OBS在大数据场景中可以替代Hadoop系统中的HDFS服务，本文介绍DataX如何对接OBS。对接步骤下载datax源码，以发布版本datax_v202308为例：下载地址。

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
迁移HDFS数据至OBS - 对象存储服务 OBS

之间进行大规模数据复制的工具，它使用Map/Reduce实现文件分发，错误处理和恢复，以及报告生成。它把文件和目录的列表作为map任务的输入，每个任务会完成源列表中部分文件的拷贝。配置指南参考Hadoop对接OBS中hadoop-huaweicloud的安装和配置方法，完成OBS相关配置。

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离
Hadoop对接OBS - 对象存储服务 OBS

logger.com.obs=ERROR 对接步骤以Hadoop 3.1.1为例（建议使用最新的版本，不推荐使用低于2.8.3版本的hadoop与hadoop-huaweicloud配套使用）。下载hadoop-3.1.1.tar.gz，并解压到/opt/hadoop-3.1

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Druid对接OBS - 对象存储服务 OBS
Druid对接OBS - 对象存储服务 OBS

Druid对接OBS 概述 Druid专为需要快速数据查询与摄入的工作流程而设计，在即时数据可见性、即席查询、运营分析以及高并发等方面表现非常出色。通过HDFS接口对接OBS，使用OBS提供的OBSA-HDFS工具，无需重新编译druid，将OBS配置为deep storage。

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Flume对接OBS - 对象存储服务 OBS
Flume对接OBS - 对象存储服务 OBS

S实现的HDFS协议不支持租约Lease机制（并发写同一个文件时将产生不可确定的状态），所以在flume场景下可以通过文件命名规则进行解决。如sink文件的命名规则：hostname-sinkname作为文件的前缀，如果一个主机上部署了多个flume agent，不同的agent要有不同的sinkname。

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Flink对接OBS - 对象存储服务 OBS
Flink对接OBS - 对象存储服务 OBS

Flink对接OBS 概述 Flink是一个分布式的数据处理引擎，用于处理有界和无界流式数据。Flink定义了文件系统抽象，OBS服务实现了Flink的文件系统抽象，使得OBS可以作为flink StateBackend和数据读写的载体。注意事项 flink-obs-fs-hadoop目前仅支持OBS并行文件系统。

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Spark对接OBS - 对象存储服务 OBS
Spark对接OBS - 对象存储服务 OBS

Spark对接OBS 概述 Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。前提条件已安装Hadoop，具体请参见Hadoop对接OBS。注意事项为了减少日志输出，在/opt/spark-2.3.3/conf/log4j.properties文件中增加配置：

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Logstash对接OBS - 对象存储服务 OBS

将数据发送到存储系统中，具体请参见Logstash。本文用于描述Logstash如何对接使用OBS。注意事项请使用较新版本的logstash，例如≥7.10.2的版本，避免使用较老版本的logstash。对接步骤以logstash-7.10.2为例。下载logstash-7

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Hive对接OBS - 对象存储服务 OBS
Hive对接OBS - 对象存储服务 OBS

Hive对接OBS 概述 Hive是一个数据仓库工具，可以对存储在分布式存储中的大规模数据进行数据提取、转化和加载，它提供了丰富的SQL查询方式来进行数据分析。前提条件已安装Hadoop，具体请参见Hadoop对接OBS。对接步骤以Hive 2.3.3为例。下载apache-hive-2

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Presto对接OBS - 对象存储服务 OBS

解释： node.environment：环境名字，Presto集群中的节点的环境名字都必须是一样的。 node.id：唯一标识，每个节点的标识都必须是唯一的。就算重启或升级Presto都必须还保持原来的标识。 node.data-dir：数据目录，Presto用它来保存log和其他数据

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
对所有账号授予指定对象的读权限 - 对象存储服务 OBS

对所有账号授予指定对象的读权限场景介绍某公司A使用OBS存储了大量全球各地的地图数据，这些数据需要对外开放供所有人查阅。在这种情况下，该公司便可以为这部分数据设置所有账号的读取权限，然后将这些数据对应的URL公开在互联网上，所有人就可以使用这个URL访问或下载这些公开数据了。

帮助中心 > 对象存储服务 OBS > 权限配置指南 > 典型场景配置案例 > 对所有账号授权
Hortonworks HDP对接OBS - 对象存储服务 OBS

软件：Ambari：2.7.1.0，HDP：3.0.1.0 部署视图更新OBSA-HDFS工具下载与hadoop版本配套的OBSA-HDFS工具：下载地址。下载OBSA-HDFS工具的jar包（如hadoop-huaweicloud-3.1.1-hw-53.8.jar）到/mnt/obsjar目录。

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据平台
Cloudera CDH对接OBS - 对象存储服务 OBS

8是OBSA的版本号。如hadoop版本为3.1.x，则选择hadoop-huaweicloud-3.1.1-hw-53.8.jar。增加hadoop-huaweicloud的jar包。在CDH集群各节点执行以下命令，命令请根据hadoop-huaweicloud的jar包名字及实际CDH版本进行适配使用。

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据平台
对所有账号授予指定目录的读权限 - 对象存储服务 OBS

对所有账号授予指定目录的读权限场景介绍当一个文件夹下的对象都需要授权所有账号访问权限时，可以通过桶策略配置授予所有账号访问文件夹内对象的权限。配置须知本案例预置的“目录只读”模板允许所有账号（所有互联网用户）对指定目录执行以下权限： GetObject：获取对象内容、获取对象元数据

 帮助中心 > 对象存储服务 OBS > 权限配置指南 > 典型场景配置案例 > 对所有账号授权
使用临时URL进行授权访问 - 对象存储服务 OBS

RL时，您需要指定URL的有效期来限制访客用户的访问时长。如果您想授予其他用户对桶或对象临时进行其他操作的权限（例如上传或下载对象），则需要生成带对应请求的URL后（例如使用生成PUT请求的URL上传对象），将该URL提供给其他用户。通过该方式可支持的操作以及相关信息见下表：

帮助中心 > 对象存储服务 OBS > Android > 临时授权访问

总条数： 2022

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置ModelArts和SFS Turbo间网络直通 - 对象存储服务 OBS

配置SFS Turbo数据自动导出到OBS桶 - 对象存储服务 OBS

对接大数据组件 - 对象存储服务 OBS

华为云MRS对接OBS - 对象存储服务 OBS

对接大数据平台 - 对象存储服务 OBS

DataX对接OBS - 对象存储服务 OBS

迁移HDFS数据至OBS - 对象存储服务 OBS

Hadoop对接OBS - 对象存储服务 OBS

Druid对接OBS - 对象存储服务 OBS

Flume对接OBS - 对象存储服务 OBS

Flink对接OBS - 对象存储服务 OBS

Spark对接OBS - 对象存储服务 OBS

Logstash对接OBS - 对象存储服务 OBS

Hive对接OBS - 对象存储服务 OBS

Presto对接OBS - 对象存储服务 OBS

对所有账号授予指定对象的读权限 - 对象存储服务 OBS

Hortonworks HDP对接OBS - 对象存储服务 OBS

Cloudera CDH对接OBS - 对象存储服务 OBS

对所有账号授予指定目录的读权限 - 对象存储服务 OBS

使用临时URL进行授权访问 - 对象存储服务 OBS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线