视频的理想与现实
据科学家研究,人类83% 的信息主要来源于视觉。人们需要信息交流,彼此沟通,而视频,则是人类社会相互联接的最好方式。
在我们的概念里,视频天然就是真实世界的客观还原,高清晰度,自然流畅; 视频天然就是实时互动的,没有延迟,自由交互; 视频自然融合,观看、互动、交互灵活组合,在各种终端中任意流转,无缝体验;视频也充满了无尽的想象力,立体视角、虚实交互、沉浸式体验,如梦如幻、激动人心……
但是,现实却有些骨感。我们看到,由于技术和资源等条件限制,视频业务场景割裂,直播、连麦互动、视频会议、视频监控等各有各的网络,各有各的架构体系,融合场景难以满足,开展新的VR/AR 业务也困难重重;视频体验远没有达到要求,普通直播延迟大于3 秒,主播和连麦用户不同步,还经常出现卡顿、花屏等现象;同时视频业务成本高昂,计算、存储等基础设施投资巨大,带宽流量费用呈线性增长。
新基建促进ICT基础设施飞跃发展,视频网络迎来升级变革
视频业务产业链,贯穿了从采集接入、内容处理、分发传输、播放显示的全生命周期过程。它背后的核心支撑,是一张基于视频流的媒体处理和分发网络。要提供这样的一张网络,并非易事,首先有三大门槛需要跨越。
网络覆盖范围要足够宽广:视频本身是资源型业务,动辄上千个边缘节点,对计算资源、网络资源要求极高,资源的投入、网络的稳定可靠运行、以及如何有效提升资源效率,成本与效率的平衡是首要考虑的问题。
对端的整合以及端云协同能力:视频网络需要支持五花八门、品类繁多的终端接入,兼容各种芯片、终端型号和操作系统版本。一个端侧SDK 要支持至少上千终端型号,大量验证测试,并且要持续更新。
音视频技术能力:如何持续提升编解码效率、如何获得更低的时延、更高清的视频质量,还有在地铁、电梯、高铁等弱网环境下,如何保持互通、清晰流畅。
除此之外还需要考虑如何应对突发大容量、如何支持亿级并发、在公网接入条件下如何保障接入安全、防网络攻击等诸多挑战,这张视频网络的背后,是研发技术、基础资源、运营运维的高门槛投入。
国家提出了新基建战略,ICT 基础设施快速发展,视频发展也迎来了新机遇。5G 的到来,解决了视频传输的大带宽、大流量的问题,延迟大幅降低;云计算带来了算力的极大增强,视频的生产、渲染和处理更快、效率更高;边缘、分布式技术的发展,带来了本地的超低时延,流量成本大幅降低。视频是5G 时代的风口业务,网络的升级,给视频业务带来了更好的体验,更多更丰富的业务创新机遇也将到来。
视频业务正在发生巨大变化:从单向的播放变为双向互动,超低延迟成为基本特征,进入毫秒时代;“云原生”成为趋势,生产上云、渲染上云、处理上云、分发上云,云服务成为基本模式;AI 技术在视频领域规模应用,带来更极致的体验和更多创新,如人脸识别、背景虚化、智能鉴黄、实时字幕、智能监控预警等。
面向未来的视频网络,我们认为应该具备几个关键特征:第一,极低时延,端到端延迟<200 毫秒;其次,超高的质量,4K/8K 超高清,在弱网条件下依然自然流畅;第三,统一的融合网络,直播观看、连麦互动、会议、监控等融合场景统一支持,无需切换;第四,超大的容量,可以支持千人互动、百万观看、亿级并发的超大规模;第五,开放互联,与运营商5G 网络、各种智能终端无缝协同,并保持前向兼容;第六,成本节省,基础设施、带宽以及运维成本大幅降低。
以RTC为代表的视频技术快速发展,成为5G时代视频业务基础,重塑行业体验
RTC(实时音视频),主要基于实时通信技术,对音频/ 视频信号进行处理、转发和传输,以前主要用在视频通信类业务上,例如会议、客服等应用。随着5G 时代的到来,ICT 基础设施的发展,新业务需求的涌现,实时音视频被重新认知和定义,并成为业界创新热点,创新应用场景层出不穷,例如互动直播、在线教育、远程医疗、企业在线营销、VR/AR 虚实互动、物联网应用等。
全新的实时音视频服务,有三个最核心的改变。
第一,全场景、一张网。基于视频流融合,一张网支持所有场景业务,播放、交互、连麦、监控等业务互通,无缝流转,突破技术限制,随需扩展,支持千人互动、亿级并发。
第二,全实时、低延迟。实时观看,播放时延小于200 毫秒;实时互动,双向交互端到端时延小于200 毫秒;实时操作,操控指令响应时长小于30 毫秒。
第三,可扩展、全流程AI。基于统一框架,提供丰富多维的AI 能力,AI 插件随需使用。AI 融入视频采、编、存、传、显全生命周期过程,智能识别、智能鉴黄、美颜降噪、虚拟背景、智能路由传输,智能检测预警……AI 让视频生产和处理更加高效,带给用户更为极致的体验。
全新的实时音视频服务带来了业务、体验和技术的升级。直播、连麦、会议灵活组合和随时切换,更多业务创新,如VR/AR、全息互动等,实现业务升级;用户对延迟无感、边看边互动,精准操控作业,体验升级;多套网络合一,灵活扩展,资源效率至少提升30%,运维效率提升50%,技术升级。
视频网络架构也发生了根本性改变,从中心式、树状结构、层层分发的模式,改变为网状、去中心化、自适应Mesh 结构;从专网、集中式设备模型,改变为分布式,基于边缘部署,随需扩展和就近接入;基于目的地寻址,多路径精准分发,管道流量模型改变;实时监控、机器学习、智能调度,自动选择最佳路径,极致效率。
使能千行百业创新,大视频创新机遇正奔涌而来
RTC 的注入,和5G、云计算、AI 等技术一起交叠应用,为视频提供更有价值、更有肥力的土壤,使能千行百业创新,大视频创新机遇正奔涌而来。
· 互动文娱行业升级:通过实时音视频服务,直播业务真正实现毫秒级实时互动体验,并带来更多新玩法。主播间互动无延迟感知,参与人数无限制,所有观众可实时互动、自由上线连麦,还可以与朋友们一起边观看比赛边实时互动交流,同时支持实时抢答、跨直播间PK、冲刺拉票等实时交互的创新场景。
· 在线教育行业升级:通过实时音视频服务,教育行业将极大改善教学互动体验,提升教学质量。视频高清在线,延迟无感知,清晰流畅;随时互动教学,小班课突破16 人限制,大班课支持千人互动,自由连麦;还可以实时监测学生学习情况,通过表情/ 姿态识别,实时自动提醒开小差的学生。
· 办公协同业务升级:基于实时音视频,下一代云会议也在持续演进,在技术、体验、业务形态等全面升级:极致音视频通信,1080p 高清晰度视频通话,200毫秒超低时延,抗50% 视频丢包,抗80% 音频丢包,在弱网环境下也能顺畅沟通;通过智能数据和文档协作,4K 超高清数据实时共享, 无线投屏,白板共享,多人标注,实时翻译,自动纪要等,实现高效协作;突破技术限制,支持千人互动同时开会,多区域可同时参加;端云结合,全场景多屏互动,无论你在会议室、办公室、在家里,还是在路上,随时随地都可接入会议,互动交流;更多的业务创新,直播+ 会议互动结合;跨企业、联接客户与伙伴的在线展会、在线营销、在线培训……
VR/AR,正在打开未来新视界
VR、AR 和自由视角等新视频业务形态正在快速发展,给人们带来更沉浸、更自由的虚实结合的全新交互体验,行业创新大量涌现。
在社交媒体领域:虚拟主播正在成为互动直播和电商带货的新方向。基于虚拟的背景,虚拟空间,呈现了一个类真实的虚拟世界;通过虚拟人,或者真人仿真,以及姿态拟合,让你同主播进行实时互动,带来不一样的虚实交互体验。
在智慧教育领域:可以呈现3D 虚拟影像,进行360°多视角立体观摩,甚至引入沉浸式声场,触觉式反馈,来开展VR/AR 互动教学,给学生带来真实的环境场景和感知交互,提升学习效果。
在工业互联网领域:进行工业仿真设计,在同比例虚拟空间中,动态调整设计原型,进行生产模拟、工艺分析和虚拟试验,缩短产品的研发周期,降低研发成本。
还有很多场景应用,VR/AR 游戏、VR/AR 社交、VR/AR 会议、VR/AR 零售……正在加速向我们的生活和生产渗透。
VR/AR 业务,对算力、网络资源的诉求呈指数级增长,将原生长在云上。从3D 建模、渲染处理、空间定位、姿体跟踪、数字孪生都承载在云上,以服务方式提供。
华为云致力于提供视频基础能力“黑土地”,使能千行百业创新
华为拥有业界最完整的端- 管- 云产业技术,在音视频领域持续耕耘30 多年,拥有多达1186 件音视频算法专利,在编解码算法、音视频网络传输、弱网对抗、媒体AI 等领域积累了深厚的技术实力。
在视频技术的演进发展过程中,华为云作为服务提供商,聚焦将基础能力做到极致,降低技术门槛,为业界提供最优质的云视频服务,使能千行百业创新。