检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
DIS通道将通知分发给下游的大数据处理服务,如数据湖工厂(DLF)。大数据处理服务接到通知后,利用委托的OBS权限对OBS中更新的数据进行实时分析处理。您可以将通知配置为按对象名称的前缀或后缀进行筛选。 假设在某大数据场景下,用户要求每隔5分钟对OBS中上传的“.mp4”后缀的视
且当网络不稳定时仍然有上传失败的风险。断点续传上传接口能有效地解决此类问题引起的上传失败,其原理是将待上传的文件分成若干个分段分别上传,并实时地将每段上传结果统一记录在checkpoint文件中,仅当所有分段都上传成功时返回上传成功的结果,否则在回调函数中返回错误码提醒用户再次调
且当网络不稳定时仍然有下载失败的风险。断点续传下载接口能有效地解决此类问题引起的下载失败,其原理是将待下载的对象分成若干个分段分别下载,并实时地将每段下载结果统一记录在checkpoint文件中,仅当所有分段都下载成功时返回下载成功的结果,否则在回调函数中返回错误码提醒用户再次调
标,从而触发函数执行。 函数工作流(FunctionGraph)执行函数处理图片、输出图片,并将图片上传至目标桶。 方案优势 帮助您快速、实时地监控到OBS桶中的对象操作。 涉及多流程业务执行时,可通过EG事件通知功能自动触发下游程序执行,节省了人工监控和执行的成本。 约束与限制
Presto对接OBS 概述 Presto分为prestoSql(现更名为Trino)和PrestoDB两大分支或是发行版。 Presto on OBS仅支持prestoSql/Trino发行版,下述对接步骤以prestoSql-333版本为例(从prestoSql-332版本开始Presto服务端必须使用JDK
通过s3fs挂载OBS对象桶 应用场景 对于原本使用本地文件系统存储数据的用户,希望把数据存储在OBS上但不改变数据的访问方式,推荐使用s3fs。 s3fs是一款基于用户空间文件系统(Filesystem in Userspace,简称FUSE)的文件系统工具,支持您在Linux
文字大小输入“600”。 水印透明度保持默认值“100”。 水印位置选择左上。 文字阴影保持不开启。 垂直边距和水平边距保持默认值“10”。 右侧会实时显示设置的样式效果。最终的样式效果如图8所示。 图8 样式obs-111 完成样式的编辑后,单击“确定”保存样式。新建成功的“obs-111”样式就会显示在样式列表中。
恢复失败的复制任务 功能说明 根据任务号(TaskId)恢复失败的复制任务。 命令结构 Windows操作系统 obsutil cp -recover=xxx [-dryRun] [-f] [-u] [-crr] [-vlength] [-vmd5] [-j=1] [-p=1]
复制对象 使用场景 用户可以根据需要将存储在OBS上的对象复制到其他路径下。复制对象操作将创建需要复制的对象的副本。在单次操作中,您可以创建最大5GB的对象副本。对于复制大于5GB的对象副本,请您使用多段上传API。通过使用copy操作,您可以: 创建对象的其他副本。 通过复制对象并删除原始对象来重命名它们。
表单上传(POST上传) 使用场景 如果待上传的文本文件、图片、视频等资源小于5GB,您可以选择表单上传,即POST操作的方式将对象上传到桶中。 POST上传作为消息体中的表单域传递,上传提交的URL为桶域名,无需指定对象名。请求行为如下所示: POST / HTTP/1.1 虽
流式上传(PUT上传) 使用场景 如果待上传的文本文件、图片、视频等资源小于5GB,您可以选择流式上传,即PUT操作的方式将对象上传到桶中。 PUT上传中参数通过请求头域传递,上传需在URL中指定对象名,请求行为如下所示: PUT /ObjectName HTTP/1.1 虽然O
配置参数说明 通过配置文件.obsutilconfig,您可以设置obsutil中的各项配置参数。 配置文件格式: endpoint=<value> ak=<value> sk=<value> token=<value> endpointCrr=<value> akCrr=<value>
Flink对接OBS 概述 Flink是一个分布式的数据处理引擎,用于处理有界和无界流式数据。Flink定义了文件系统抽象,OBS服务实现了Flink的文件系统抽象,使得OBS可以作为flink StateBackend和数据读写的载体。 注意事项 flink-obs-fs-hadoop目前仅支持OBS并行文件系统。
增量同步复制对象 功能说明 将源桶指定路径下的所有对象同步到目标桶指定路径,使两边内容保持一致。这里的增量同步有两层含义:1)增量,依次比较源对象和目标对象,只复制存在变化的源对象;2)同步,命令执行完成后,保证源桶指定路径是目标桶指定路径的子集,即源桶指定路径下的所有对象均能在目标桶中找到对应对象。
恢复失败的上传任务 功能说明 根据任务号(TaskId)恢复失败的上传任务。 命令结构 Windows操作系统 obsutil cp -recover=xxx [-arcDir=xxx] [-dryRun] [-f] [-u] [-vlength] [-vmd5] [-j=1] [-p=1]
追加上传 追加上传可实现对同一个对象追加数据内容的功能。您可以通过appendObject进行追加上传。示例代码如下: NSString *filePath = [[NSBundle mainBundle] pathForResource:@"FileName" ofType:@"FileSuffix"];
复制对象 功能说明 复制对象或按对象名前缀批量复制对象。 复制对象或批量复制时,请确保OBS桶中的源对象不发生变化,否则可能产生复制失败或者数据不一致的问题。 如果被复制对象的存储类型为cold,必须首先恢复被复制对象,否则无法复制成功。 复制时需要有被复制对象的读权限和目标桶的写权限。
跨区域复制 当前,OBS支持一个源桶到一个目标桶配置一条复制所有对象的跨区域复制规则,或多条按前缀匹配的跨区域复制规则。 跨区域复制不保证时效性,配置跨区域复制规则后,可能会出现对象不会立即进行复制的情况,请耐心等待。 开启WORM保留策略的桶暂不支持跨区域复制能力。 使用场景
流式上传(PUT上传) 使用场景 如果待上传的文本文件、图片、视频等资源小于5GB,您可以选择流式上传,即PUT操作的方式将对象上传到桶中。 PUT上传中参数通过请求头域传递,上传需在URL中指定对象名,请求行为如下所示: PUT /ObjectName HTTP/1.1 虽然O
对接大数据组件 支持的大数据组件简介 Hadoop对接OBS Hive对接OBS Spark对接OBS Presto对接OBS Flume对接OBS DataX对接OBS Druid对接OBS Flink对接OBS Logstash对接OBS 父主题: 大数据场景下使用OBS实现存算分离