低成本,一键创建AI应用

Serverless技术,以其简单高效的开发,细粒度低成本的资源管理,极致弹性、简化运维等一系列特点成为了AIGC应用首选技术栈。

华为云Serverless技术面向AI创新企业、个人开发者, 简化了AIGC应用的开发难度,提升了AIGC应用的发布效率。最重要的是,提供毫秒级弹性扩缩容以轻松应对流量洪峰,细粒度的资源调用能力,真正实现大模型应用即开、即关、即时响应,为AI创新者带来极低成本、极简创建的全新体验。

华为云全球连接服务CPS

众多AI创新者反馈,构建AIGC应用时常遇这些挑战

众多AI创新者反馈,构建AIGC应用时常遇这些挑战

华为云Serverless如何低成本极简创建AI应用?

极简快速创建AI应用,全托管“0”资源运维

• 利用应用模板,5分钟一键部署和发布AI应用,研发效能提升80%

• 全托管,软件漏洞自动修复,平台版本自动更新

• 支持代码包,容器镜像上传,帮助开发者快速完成从 0 到 1 业务开发,一键克隆、构建、打包和发布

• 华为云Serverless 默认提供Stable Diffusion WebUI及自定义模型上传功能,用户可以按照自身需求上传对应的文生图模型满足自身个性化的图片生成需求

• 一键部署模型API,和前端简单集成,应用既可上线

• 华为云Serverless应用中心能方便快捷的完成Stable Diffusion的一键部署、开通

低成本,精确算力供给AI应用

• 华为云支持多函数实例共享显卡,会根据选择的显存大小进行算力和显存隔离,vGPU可细粒度灵活组合(1/20 GPU分片),毫秒粒度计费。提升GPU硬件资源的利用率并降低成本

• 创建AI应用时会按调用次数收费,无请求不计费,降低AI应用成本

• 对于存在明显波峰波谷业务特征的AI绘图业务,华为云Serverless会避免闲时资源浪费,根据业务请求量自动扩容;依托于华为云函数工作流细粒度的资源调度能力,大大提升了应用调度的资源利用率,相比于自建方案节省更多的底层资源成本

• 解耦大模型全量推理和增量推理,精确算力供给

极速响应,降低AI应用业务请求时延

• 精准预测预热,最小化预留,百毫秒级请求响应

• 资源分层预热,模型分级缓存,异构函数秒级冷启动

Serverless 函数工作流 FunctionGraph:八大关键能力,助力一键创建AI应用

Serverless 函数工作流 FunctionGraph:八大关键能力,助力一键创建AI应用

Serverless 都可以应用在哪些AI场景?

Serverless 都可以应用在哪些AI场景?

游戏场景图片生成

  • 1、游戏场景创作 2、游戏角色设计

    3、游戏道具设计 4、游戏UI设计

  • 如:某游戏平台使用Serverless一键创建AI画图应用Stable Diffusion,批量生成游戏场景图、游戏海报等。

教育、绘本、插画图片生成

  • 1、教学资源制作 2、虚拟教学助手

    3、教学视频制作 4、教学游戏开发

  • 如:某教育公司使用Serverless一键创建AI画图应用Stable Diffusion,批量生成插画、儿童绘本图片、宣传海报等。

电商图片生成

  • 1、电商模特生成 2、商品图片生成

    3、虚拟试衣间 4、商品视频制作

  • 如:某教育公司使用Serverless免费一键创建AI画图应用ComfyUI+Flux版,批量生成插画、儿童绘本图片、宣传海报等。

广告、营销、设计行业图片生成

  • 1、个性化营销 2、内容审核

    3、服装设计 4、广告创意

  • 如:某教育公司使用Serverless免费一键创建AI画图应用ComfyUI版,批量生成服装设计、广告图片等。AI对话-ChatGLM3生成营销咨询等。

客户案例

华为云 Stable Diffusion案例: 低成本构建文生图应用,实现AI绘图

华为云 Stable Diffusion案例: 低成本构建文生图应用,实现AI绘图

  • 某在线游戏平台:为全球用户提供优质精彩的游戏、娱乐及服务。产品涵盖数十款棋牌类手游(斗地主、捕鱼、象棋等)及休闲类手游。

  • 客户诉求


    • 素材库精修


    • 人物道具设计


    • 海量游戏海报生成


    • 设计师减少工作量,提高效率


    • 业务按需使用、无需提前部署


  • 客户价值


    • 一键部署、便于操作,免运维;20分钟完成了文生图应用的业务部署


    • 按需使用,根据调用次数收费,无请求不计费;客户每天生成3000+图片,实际使用GPU时间仅3.47小时,节省85%+资源成本

华为云Serverless,赋能丰图科技AI推理成本锐减30%,可靠性翻倍

华为云Serverless,赋能丰图科技AI推理成本锐减30%,可靠性翻倍

  • 丰图科技(深圳)有限公司 源于顺丰科技地理信息研发中心,最早负责构建物流场景的工业级地图、支撑顺丰集团的数字化转型。


    目前丰图科技已经搭建了智慧护航平台和丰图智行平台,为物流企业提供货运安全监管和风控服务。由于将大量计算部署在了云端,如何节约算力、实现降本增效也十分重要。丰图科技利用华为云函数工作流FunctionGraph实现了推理算法事件驱动、 设备自检算法、 同时无需运维计算资源,使团队只需要关注业务本身,从而可以更好的控制使用成本。



  • 华为云解决方案


    驾驶辅助智能硬件、智慧交通监督平台、7*24小时运营支撑,实现三位一体安全驾驶

    丰图科技还通过驾驶辅助智能硬件、智慧交通监督平台、7*24小时运营支撑,实现了三位一体的安全驾驶解决方案。并以安全云平台为核心,通过风险预测、实时干预、事故调查表、统计报表等方式,结合驾驶辅助硬件、设备算法迭代,系统自动报警实用技术,大大降低了商用车安全事故,保障了司机的每一次安全驾驶。

    引入了DMS疲劳检测,高危等级风险事件召回率提升32%

    针对长途货运司机容易疲劳驾驶的问题,丰图科技的安全驾驶解决方案引入了DMS疲劳检测,支持云端DMS告警补偿和告警清洗,自动检测驾驶员疲劳、分心、吸烟打电话、摄像头被遮挡等行为。基于精简版ResNet图像分类,对摄像头状态判断准确率达到99%。能够减少40%以上的无效告警和10%左右的护航人力投入,高危等级风险事件召回率提升32%。



  • 实践效果


    节约算力及成本,GPU最小1/16粒度配置,按使用量计费

    利用华为云函数工作流FunctionGraph实现了推力算法事件驱动,全自动按请求并发量弹性计算实例,保障了资源的按需使用;GPU最小1/16粒度配置,按使用量计费,从而避免了昂贵算力的资源限制。同时FunctionGraph不需要运维计算资源,只需要关注业务本身,从而可以更好的控制使用成本。


    实现设备自检算法,减少运维工作量

    通过华为云FunctionGraph实现设备自检算法,设备自检业务流程中,将图片计算的部分使用GPU资源的工作放在FunctionGraph中完成。并利用FunctionGraph自带的监控日志系统观察,减少了运维工作量。全自动弹性实例也更容易应对业务量变化带来的资源需求的波动,提高了业务稳定性。


    成本降低30%,可靠性则提升至100%

    华为云FunctionGraph是根据函数调用次数、活跃/闲置内存以及GPU使用量进行收费,粒度到1ms级别,只在函数被调用时计费。华为云FunctionGraph助力丰图科技成本降低30%,可靠性提升100%。

华为云Serverless常见问题解答

华为云Serverless常见问题解答

美术在游戏开发过程中占比高,尤其是在临近项目上线时,美术团队的人数,可以占到整体的一半以上

AI绘画任务随时执行,降低人力成本,云端AI绘画根据创建应用时的调用次数收费,无请求不计费。

公司业务对GPU强依赖,而昂贵的GPU算力成为制约业务发展的瓶颈。急需解决算力成本问题

华为云支持多函数实例共享显卡,会根据选择的显存大小进行算力和显存隔离,vGPU可细粒度灵活组合(1/20 GPU分片),毫秒粒度计费。提升GPU硬件资源的利用率并降低成本。

绘图应用响应延迟缓慢,客户提一个画图需求,应用要加载近1分钟才能响应

预热基础异构函数实例:提前初始化设备和依赖库,设备初始化时延降低至0ms。

模型加载和计算pipeline化:模型按Layer分批加载,并根据用户SLA和模型推理时延历史数据,构建最优pipeline, 降低参数加载和模型推理总时延。

华为云Serverless精选文章推荐

华为云Serverless精选文章推荐

华为云Serverless,海量企业的共同选择

华为云Serverless,海量企业的共同选择