检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Turbo:文件系统类型为“HPC型”,存储类型请根据存储容量和性能需求选择,AI场景建议选择250MB/s/TiB及以上的存储类型。 ModelArts:AI开发平台,采用多机多卡分布式训练。 VPC:虚拟私有云和子网。 算法及数据:准备AI训练需要的算法及数据集,如Swin-Transformer算法,及ImageNet21K数据集。
有者或者拥有桶的删桶policy权限的用户可以执行删除桶的操作,要删除的桶必须是空桶。如果桶中有对象或者有多段任务则认为桶不为空,可以使用列举桶内对象和列举出多段上传任务接口来确认桶是否为空。 注: 如果删除桶时,服务端返回5XX错误或超时,系统需要时间进行桶信息一致性处理,在此
Authorization: auth 请求消息参数 该请求通过请求消息参数指定多段上传任务以及列出的段数量,参数的具体含义如表1所示。 表1 请求消息参数 参数名称 描述 是否必选 uploadId 多段上传任务的id。 类型:String 默认值:无。 是 max-parts 规定在列举已上传段响应中的最大Part数目。
创建桶 您可以通过OBS管理控制台、API、SDK、OBS Browser+、obsutil方式创建桶。桶是OBS中存储对象的容器。您需要先创建一个桶,然后才能在OBS中存储数据。 华为云OBS控制台支持在创建桶时选择源桶,同步桶配置。选择后可复制源桶的以下配置信息:区域 / 数据冗余策略
支持的大数据组件简介 在华为云大数据存算分离方案中,OBS除了可以与大数据平台对接外,还可以直接与开源的大数据组件对接。 当前支持的大数据组件如下: Hadoop Hive Spark Flume DataX Druid Flink logstash 父主题: 对接大数据组件
涉政等违法违规内容,OBS和第三方平台(微信/支付宝/百度等)检测到后会封禁此资源。第三方平台在封禁此资源的同时,会将OBS域名列为不信任域名,导致其他合法使用OBS域名的用户也受到影响。 解决方案 需要通过第三方平台,如微信/支付宝/百度等平台或小程序使用OBS的用户,建议使用自定义域名访问OBS资源,避免封禁。
流程如图1所示。 图1 操作流程 配置的核心是完成大数据平台与OBS对接,实现OBS作为大数据的统一数据湖存储。本文档提供三种主流大数据平台的对接指导,详情请参见支持的大数据平台简介。 (可选)OBS除了可以与主流大数据平台对接外,还可以直接与开源的大数据组件对接。当您使用开源的
obsutil_checkpoint。 说明: 每个分段下载任务会产生唯一对应的断点记录文件并保存至该文件夹的down子文件夹下,分段任务执行成功后,对应的断点记录文件会被自动删除;分段任务执行失败或被中断后,下次执行该分段任务时会尝试通过对应的断点记录文件恢复任务。 j 附加参数,批量下载时可选 同步
列举多段上传任务 通过列举桶中的多段上传任务,您可以获得已初始化多段上传任务的列表,已初始化多段上传任务是指初始化后还未合并以及未取消的多段上传任务。每个请求将返回最多1000个多段上传任务,如果正在进行的多段上传任务超过1000个,您需要发送其他请求以检索剩余的多段上传任务。 合并段。
obsutil_checkpoint。 说明: 每个分段上传任务会产生唯一对应的断点记录文件并保存至该文件夹的upload子文件夹下,分段任务执行成功后,对应的断点记录文件会被自动删除;分段任务执行失败或被中断后,下次执行该分段任务时会尝试通过对应的断点记录文件恢复任务。 j 附加参数,同步文件夹时可选
obsutil_checkpoint。 说明: 每个分段复制任务会产生唯一对应的断点记录文件并保存至该文件夹的copy子文件夹下,分段任务执行成功后,对应的断点记录文件会被自动删除;分段任务执行失败或被中断后,下次执行该分段任务时会尝试通过对应的断点记录文件恢复任务。 j 附加参数,批量复制时可选 同步
分段复制 分段复制是分段上传的一种特殊情况,即分段上传任务中的段通过复制OBS指定桶中现有对象(或对象的一部分)来实现。您可以通过copyPart来复制段。以下代码展示了如何使用分段复制对象: static OBSClient *client; NSString *endPoint
headers.put("Authorization", auth); } } 代码示例:初始化分段上传任务 通过Header鉴权访问OBS,初始化多段上传任务,上传的桶名为examplebucket,对象为objectName。 1 2 3 4 5 6 7
不会以任何方式存储您的主密钥,您必须自行保证主密钥的正确性与完整性,如果主密钥丢失或用错,将会导致您的加密后数据无法解密,OBS 不会承担任何责任。 OBS SDK 会将解密所需的必要辅助信息存储在相应对象的元数据中,在对加密对象进行移动、复制、修改元数据等操作时,您需要保证不会修改辅助信息。如果
删除桶 功能说明 删除桶,待删除的桶必须为空(不包含对象、历史版本对象或分段上传碎片)。 如果要删除非空桶,请先使用删除分段上传任务命令和删除对象命令,将桶清空后再执行删除桶命令。 命令结构 Windows操作系统 obsutil rm obs://bucket [-f] [-config=xxx]
用户可根据需要删除已创建的桶。 前提条件 待删除的桶为空。 只有桶的所有者才能删除桶。 删除桶之前必须确保桶内的对象已全部删除,并且桶内没有未完成的多段上传任务。 操作步骤 登录OBS Browser+。 选中待删除的桶,单击“删除”。 用户删除桶后,需要等待30分钟才能创建同名桶和并行文件系统。
存储的数据时,CDN中缓存的过时数据也需要进行更新,可以使用CDN自动刷新功能来自动通知CDN去更新数据。因此,通过配置自动刷新策略,可以保证CDN节点上的缓存数据和源站(OBS)的数据一致。 约束与限制 已开启多版本控制功能的桶不支持该功能。 不支持自动刷新文件夹缓存。 不支持跨租户的CDN自动刷新。
理操作,如创建桶、上传文件/文件夹、下载文件/文件夹、删除文件/文件夹等。对于熟悉命令行程序的用户,obsutil能在执行批量处理、自动化任务场景能为您带来更优体验。 obsutil适用于Windows、Linux和macOS三大主流的操作系统,在各操作系统上推荐使用的版本如表1
将本地文件拖拽至“上传对象”区域框内来添加对象。 也可以通过单击区域框内的“添加文件”,选择本地文件进行添加。 其他参数保持默认,单击“上传”。 右侧自动弹出任务中心页面,可在任务中心查看对象上传状态。上传成功的对象将在对象列表中展示。 步骤三:下载对象 当对象上传至桶后,您可以将对象下载至浏览器默认保存路径或本地指定路径。
S服务。通过迁移服务,用户只需在控制台配置简单的连接参数以及迁移任务,即可把数据从第三方云厂商轻松、平滑地迁移至OBS。 大数据场景下使用OBS实现存算分离 本最佳实践主要提供华为云大数据存算分离方案中不同大数据平台和大数据组件与对象存储服务OBS的对接指导,以及HDFS数据迁移至对象存储服务OBS的方案。