检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
与其他服务的关系 对象存储服务OBS与周边服务的依赖关系如图1所示。 图1 对象存储服务OBS与其他服务的关系示意图 表1 与其他服务的关系 交互功能 相关服务 位置 通过相关服务将数据迁移到OBS 对象存储迁移服务(Object Storage Migration Service,OMS)
数据快递:适用于海量数据归档场景,离线邮寄上云 建议搭配服务 数据快递服务 DES,弹性云服务器 ECS 图6 备份归档 HPC 场景描述 OBS配合弹性云服务器(ECS)、弹性伸缩(AS)、云硬盘(EVS)、镜像服务(IMS)、统一身份认证服务(IAM)和云监控服务(CES),为HPC提供大容量、大单流带宽、安全可靠的解决方案。
Spark对接OBS 概述 Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。 前提条件 已安装Hadoop,具体请参见Hadoop对接OBS。 注意事项 为了减少日志输出,在/opt/spark-2.3.3/conf/log4j.properties文件中增加配置:
/_common/下增加hdfs-site.xml,配置如下(其中endpoint按照桶所在的实际endpoint填写): 启动Druid服务。 父主题: 对接大数据组件
Flink对接OBS 概述 Flink是一个分布式的数据处理引擎,用于处理有界和无界流式数据。Flink定义了文件系统抽象,OBS服务实现了Flink的文件系统抽象,使得OBS可以作为flink StateBackend和数据读写的载体。 注意事项 flink-obs-fs-hadoop目前仅支持OBS并行文件系统。
一个对象可以同时存在多个多段上传任务;每个多段上传任务在初始化时可以附加消息头信息,包括acl、用户自定义元数据和通用的HTTP消息头contentType、contentEncoding等,这些附加的消息头信息将先记录在多段上传任务元数据中。 在指定桶中初始化分段上传任务。 接口约束
断点续传下载 开发过程中,您有任何问题可以在github上提交issue,或者在华为云对象存储服务论坛中发帖求助。接口参考文档详细介绍了每个接口的参数和使用方法。 当下载大对象到本地时,经常出现因网络不稳定或程序崩溃导致下载失败的情况。失败后再次重新下载不仅浪费资源,而且当网络不
成三级域名形式,又称为虚拟主机访问域名。 通过内网访问OBS 通过内网访问OBS主要指通过华为云服务之间的内部通信网络访问OBS。通过内网访问OBS产生的流入流量(数据上传到OBS等写操作)和流出流量(下载OBS数据等读操作)都是免费的。 例如在弹性云服务器(Elastic Cloud
enabled:Presto使用Discovery服务去找到集群中的所有节点。每个Presto实例在启动时都会在Discovery服务里注册。这样可以简化部署,不需要额外的服务,Presto的coordinator内置一个Discovery服务。 discovery.uri:Discovery服务的URI。将example
对象数据的MD5值(经过Base64编码),提供给OBS服务端,校验数据完整性。OBS服务端会将该MD5值与对象数据计算出的MD5值进行对比,如果不匹配,返回HTTP 400错误。 约束限制: 对象数据的MD5值必须经过Base64编码。 如果不设置对象的MD5值,OBS服务端会忽略对对象数据的MD5值校验。
形成三级域名形式,又称为虚拟主机访问域名。 通过内网访问OBS 通过内网访问OBS主要指通过服务之间的内部通信网络访问OBS。通过内网访问OBS产生的流入流量(数据上传到OBS等写操作)和流出流量(下载OBS数据等读操作)都是免费的。 例如在弹性云服务器(Elastic Cloud
对象数据的MD5值(经过Base64编码),提供给OBS服务端,校验数据完整性。OBS服务端会将该MD5值与对象数据计算出的MD5值进行对比,如果不匹配则上传失败,返回HTTP 400错误。 约束限制: 对象数据的MD5值必须经过Base64编码。 如果不设置对象的MD5值,OBS服务端会忽略对对象数据的MD5值校验。
contentMd5 String 可选 参数解释: 对象数据的MD5值(经过Base64编码),提供给OBS服务端,校验数据完整性。 取值范围: 按照RFC 1864标准计算出消息体的MD5摘要字符串,即消息体128-bit MD5值经过Base64编码后得到的字符串。 示例:n58IG6hfM7vqI4K0vnWpog==
算资源、存储资源以及服务器数量都会有明显下降,同时资源利用率也能得到显著提升,可帮助企业降低业务综合成本。 文档使用范围 本最佳实践主要提供华为云大数据存算分离方案中不同大数据平台和大数据组件与对象存储服务OBS的对接指导,以及HDFS数据迁移至对象存储服务OBS的方案。 父主题:
对象数据的MD5值(经过Base64编码),提供给OBS服务端,校验数据完整性。OBS服务端会将该MD5值与对象数据计算出的MD5值进行对比,如果不匹配,返回HTTP 400错误。 约束限制: 对象数据的MD5值必须经过Base64编码。 如果不设置对象的MD5值,OBS服务端会忽略对对象数据的MD5值校验。
对象数据的MD5值(经过Base64编码),提供给OBS服务端,校验数据完整性。OBS服务端会将该MD5值与对象数据计算出的MD5值进行对比,如果不匹配,返回HTTP 400错误。 约束限制: 对象数据的MD5值必须经过Base64编码。 如果不设置对象的MD5值,OBS服务端会忽略对对象数据的MD5值校验。
本最佳实践主要提供华为云大数据存算分离方案中不同大数据平台和大数据组件与对象存储服务OBS的对接指导,以及HDFS数据迁移至对象存储服务OBS的方案。 数据备份 使用备份软件实现本地数据备份至OBS Commvault、爱数云备份服务(AnyBackup Cloud)等第三方备份软件
对象数据的MD5值(经过Base64编码),提供给OBS服务端,校验数据完整性。OBS服务端会将该MD5值与对象数据计算出的MD5值进行对比,如果不匹配,返回HTTP 400错误。 约束限制: 对象数据的MD5值必须经过Base64编码。 如果不设置对象的MD5值,OBS服务端会忽略对对象数据的MD5值校验。
对象数据的MD5值(经过Base64编码),提供给OBS服务端,校验数据完整性。OBS服务端会将该MD5值与对象数据计算出的MD5值进行对比,如果不匹配,返回HTTP 400错误。 约束限制: 对象数据的MD5值必须经过Base64编码。 如果不设置对象的MD5值,OBS服务端会忽略对对象数据的MD5值校验。
默认取值: 无 responseHeaders Map<String, Object> 参数解释: 响应消息头列表,由多个元组构成。元组中String代表响应消息头的名称,Object代表响应消息头的值。 默认取值: 无 deletedObjectResults List<DeleteObjectResult>