边缘AI研发落地生态挑战调研报告

来源微信公众号:容器魔方

前言:随着边缘设备的广泛使用和性能提升,将机器学习相关的部分任务迁移到边缘,也即边缘AI技术,已成为必然趋势。但仅凭技术是不足够完成落地和产业转化的,近日我们启动了边缘AI研发落地生态挑战调研。我们发现,当前学界业界在落地过程已经遇到各式各样的困难,重点生态挑战包括数据集和配套算法难以获取、通用方案无法满足特定业务、缺乏商业成功案例等。

基于一些落地经验,华为云边缘云创新实验室(ECIL,Edge Cloud Innovation Lab,Huawei Cloud)系列文章中曾介绍过数据异构等四大技术挑战。针对这些挑战,各个技术方案落地与成果转化到产业的进程正在紧锣密鼓地进行。但仅凭技术是不足够完成落地和产业转化的。当前学界业界很多团队已经遇到各式各样的困难,比如数据集难以获取、通用方案无法满足特定业务、缺乏商业成功案例等。

因此除了技术挑战外,华为云边缘云创新实验室一直密切关注边缘AI的生态挑战。为了让更多边缘AI领域的朋友多快好省地完成技术研发落地和商业闭环,华为云边缘云创新实验室启动了边缘AI研发落地生态挑战调研。

本次调研通过问卷发放的方式,希望进一步了解边缘AI方案落地与产业落地过程中遇到的生态挑战。截至2021年11月29日,已回收有效答卷175份,问卷开放选项采集到49条补充意见和8条补充建议。对答卷中共计20项量表题项进行分析,信度为0.975。

*比如研发资源难获取、工具链不完备等主要依赖社区分工与共享的非技术挑战,在本文中定义为生态挑战

**信度指同一问卷对同一组对象重复测量时所得结果的一致性程度,用于测量样本回答结果是否可靠。如果在0.8以上,则该测验或量表的信度非常好;如果低于0.6,量表就需要重新设计题项。

根据调研结果,对边缘AI各角色而言,当前阻碍研发落地,首当其冲生态挑战分别是:

  1. 算法开发者:“真实业务数据集及其基线算法、预训练模型难以获取”
  2. 服务开发者:“通用方案整体性能不一定满足特定业务需求”
  3. 技术布道者:“缺乏商业成功案例”

具体调研报告结果请见下文:

调研对象职业主要是工业界从业者(53.45%),其次是在校学生(31.03%)和学术界研究者, 如下图所示:

调研对象的技术方向主要是边缘AI及其应用(55.75%)、AI及其应用(49.43%)、边缘计算及其应用(42.53%)。也有约四分之一的方向为云计算及其应用(25.86%),以及少量的其它方向(13.22%)。如下图所示:

边缘AI算法开发者

本问卷中,边缘AI算法开发者是指研发联邦学习、协同推理乃至深度学习调度等边缘AI典型算法的角色。有80.46%调研对象填写了边缘AI算法开发者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。

本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。

平均分

若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI算法开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的1.43分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。

其中,平均分值最高(6.87分)的挑战是:

“真实业务数据集及其基线算法、预训练模型难以获取”

在截尾均值* 6.09分以上的其它头部挑战还包括:

“算法研发迭代中,重复部署整套端边云系统过于沉重”

“缺乏AI工具,包括资源监控、节点仿真、标注工具等”

“算法找不到对应业务场景,或很难得知实际业务落地性能”

*截尾均值指是指在一个数列中,去掉两端的极端值后所计算的算术平均数。在本问卷中用于屏蔽最后一个开放选项的影响,下同。

从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化算法开发者各项挑战平均分:

“边缘AI及其应用”方向下各职业平均分值最高的算法开发挑战分别是:

工业界:“缺乏AI工具,包括资源监控、节点仿真、标注工具等” (平均分7.5)

学术界:“缺乏真实业务及其研究需求的固定来源” (平均分7.14)

在校学生:“真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.68)


在截距均值以上的其它头部挑战还包括:

工业界(截距均值6.19):

“真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.1)

“算法研发迭代中,重复部署8整套端边云系统过于沉重”(平均分7)

“边缘AI系统部署等起步过程中缺乏指南文档”(平均分6.35)


学术界(截距均值6.30):

“真实业务数据集及其基线算法、预训练模型难以获取”(平均分6.96)

“缺乏AI工具,包括资源监控、节点仿真、标注工具等”(平均分6.72)


在校学生(截距均值6.77):

“缺乏真实业务及其研究需求的固定来源”(平均分7.41)

“算法找不到对应业务场景,或很难得知实际业务落地性能”(平均分7.59)

亟需改进

对于边缘AI算法开发者,问卷中提及的挑战被选为“亟需改进”的比例通常三分之一左右,高于“还有其他重要挑战”的6.36%,可以认为各个挑战都有相当的迫切需求。


其中被选为“亟需改进”的挑战中比例最高(42.77%)的是:

“真实业务数据集及其基线算法、预训练模型难以获取”


在截尾均值(33.33%)以上的其它头部挑战还包括:

“算法研发迭代中,重复部署整套端边云系统过于沉重”

“缺乏AI工具,包括资源监控、节点仿真、标注工具等”

“算法找不到对应业务场景,或很难得知实际业务落地性能”

“边缘AI系统部署等起步过程中缺乏指南文档”


可以看到,除了一个挑战,“亟需改进”和“平均分”头部挑战基本保持一致,这个有区别的挑战是:

“边缘AI系统部署等起步过程中缺乏指南文档”

但可以观察到,除了“亟需改进”维度,该挑战其实在“平均分”维度也是非常接近头部(距离截尾均值0.02),这说明其重要性。

可改进

问卷中的绝大部分挑战都以较大比例(63.1% - 69.94% )被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为13.87%,说明列举在问卷中相关挑战大部分都明显有改进的需求。


其中,被认为“可改进”的挑战中比例最高(69.94%)的是:

“真实业务数据集及其基线算法、预训练模型难以获取”


在截尾均值(67.06%)以上的其它头部挑战还包括:

“缺乏真实业务及其研究需求的固定来源”

“边缘AI系统部署等起步过程中缺乏指南文档”

“缺乏AI工具,包括资源监控、节点仿真、标注工具等”

“算法研发迭代中,重复部署整套端边云系统过于沉重”


与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。

1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急。这些可能看上去更“长远”的“重要不紧急”挑战包括:

“缺乏真实业务及其研究需求的固定来源”

“边缘AI系统部署等起步过程中缺乏指南文档”

第二个挑战也与“亟需改进”部分结论一致。


2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:

“算法研发迭代中,重复部署整套端边云系统过于沉重”

“缺乏AI工具,包括资源监控、节点仿真、标注工具等”

小结

对边缘AI算法开发者有以下结论:

1. 平均分值最高(6.87分)的挑战是:

“真实业务数据集及其基线算法、预训练模型难以获取”


2.其它头部重要挑战中

“重要不紧急”头部重要挑战包括:

“缺乏真实业务及其研究需求的固定来源”“边缘AI系统部署等起步过程中缺乏指南文档”

“重要且紧急”头部重要挑战包括:

“算法研发迭代中,重复部署整套端边云系统过于沉重”“缺乏AI工具,包括资源监控、节点仿真、标注工具等”


3. “边缘AI及其应用”方向下算法开发各职业平均分值最高的生态挑战分别是:

工业界:

“缺乏AI工具,包括资源监控、节点仿真、标注工具等” (平均分7.5)

学术界:

“缺乏真实业务及其研究需求的固定来源” (平均分7.14)

在校学生:

“真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.68)


问卷中也尝试调研边缘AI算法开发其余重要挑战,调研结果词云如下所示,包括边缘AI概念与定义、硬件方案、人才协作、工具与文档、场景需求、AI效果等24条意见,由于篇幅限制不一一阐述。

边缘AI服务开发者

本问卷中,边缘AI服务开发者是指,在给定算法基础上开发工业、Re-ID、能源、机器人等边缘AI服务的角色。有74.90%的调研对象填写了边缘AI服务开发者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。


本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。

平均分

若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI服务开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的1.24分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。


其中,平均分值最高(6.76分)的挑战是:

“通用方案整体性能不一定满足特定业务需求”


在截尾均值6.09分以上的其它头部挑战还包括:

“自研业务算法和系统方案周期长成本高”

“方案效果复现困难或通用方案应用范围存疑”

从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化服务开发者各项挑战平均分:

“边缘AI及其应用”方向下各职业平均分值最高的服务开发挑战完全一致:

工业界:

“通用方案整体性能不一定满足特定业务需求” (平均分7.1)

学术界:

“通用方案整体性能不一定满足特定业务需求” (平均分7.8)

在校学生:

“通用方案整体性能不一定满足特定业务需求”(平均分7.5)


在截距均值以上的其它头部挑战还包括:

工业界(截距均值5.99):

“自研业务算法和系统方案周期长成本高”(平均分6.63)

“方案效果复现困难或通用方案应用范围存疑”(平均分6.1)


学术界(截距均值5.75):

“自研业务算法和系统方案周期长成本高”(平均分7.00)

“方案效果复现困难或通用方案应用范围存疑”(平均分6.60)


在校学生(截距均值5.84):

“方案效果复现困难或通用方案应用范围存疑”(平均分6.88)

“自研业务算法和系统方案周期长成本高”(平均分6.46)

亟需改进

对于边缘AI服务开发者,问卷中提及的挑战被选为“亟需改进”的比例都在20%以上,高于“还有其他重要挑战”的6.36%,可以认为各个挑战都有一定的迫切需求。


其中被选为“亟需改进”的挑战中比例最高(36.78%)的是:

“通用方案整体性能不一定满足特定业务需求”


在截尾均值(25.57%)以上的其它头部挑战还包括:

“自研业务算法和系统方案周期长成本高”

“现场人员只会开关机,希望简化现场安装部署”


与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。

1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值0.06),这可能说明该挑战比较重要,而且需求比较迫切,这个挑战是:

“现场人员只会开关机,希望简化现场安装部署”


2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,可能是“重要不紧急”的、更为“长远”的需求,这个挑战是:

“方案效果复现困难或通用方案应用范围存疑”

可改进

问卷中的绝大部分挑战都以较大比例(59.77% - 68.96% )被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为10.92%,说明列举在问卷中相关挑战大部分都明显有改进的需求。


其中,被认为“可改进”的挑战中比例最高(68.96%)的是:

“通用方案整体性能不一定满足特定业务需求”


在截尾均值(61.78%)以上的其它头部挑战还包括:

“自研业务算法和系统方案周期长成本高”

“方案效果复现困难或通用方案应用范围存疑”


与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。

1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急,看上去更“长远”的“重要不紧急”挑战包括:

“方案效果复现困难或通用方案应用范围存疑”

这与“亟需改进”章节结论一致。


2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:

“现场人员只会开关机,希望简化现场安装部署”

这与“亟需改进”章节结论一致。

小结

对边缘AI服务开发者有以下结论:

1.平均分值最高(6.76分)的挑战是:

“通用方案整体性能不一定满足特定业务需求”


2.其它头部重要挑战中

“重要不紧急”头部重要挑战包括:

“方案效果复现困难或通用方案应用范围存疑”

“重要且紧急”头部重要挑战包括:

“现场人员只会开关机,希望简化现场安装部署”

头部重要挑战还包括:

“自研业务算法和系统方案周期长成本高”


3. “边缘AI及其应用”方向下服务开发各职业平均分值最高的生态挑战完全一致:

工业界:

“通用方案整体性能不一定满足特定业务需求” (平均分7.1)

学术界:

“通用方案整体性能不一定满足特定业务需求” (平均分7.8)

在校学生:

“通用方案整体性能不一定满足特定业务需求”(平均分7.5)


问卷中也尝试调研边缘AI服务开发其余重要挑战,调研结果词云如下所示。包括场景定制化、培训与指南、部署安装、硬件资源、技术方案等18条挑战,由于篇幅原因不一一阐述。

边缘AI技术布道者

本问卷中,边缘AI技术布道者是指开展边缘AI技术演讲布道,推广甚至销售现有边缘AI技术与服务的角色。有69.94%调研对象填写了边缘AI技术布道者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。


本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。

平均分

若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI技术布道者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的0.73分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。

其中,平均分值最高(6.61分)的挑战是:

“缺乏商业成功案例”


在截尾均值5.77分以上的其它头部挑战还包括:

“缺乏与现有方案系统对比,包括成本、部署要求”

“受众对边缘AI不了解”


从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化技术布道者各项挑战平均分:

“边缘AI及其应用”方向下各职业平均分值最高的技术布道挑战分别是:

工业界:

“缺乏与现有方案系统对比,包括成本、部署要求” (平均分6.63)

学术界:

“缺乏商业成功案例” (平均分6.59)

在校学生:

“受众对边缘AI不了解”(平均分6.25)


在截距均值以上的其它头部挑战还包括:

工业界(截距均值5.98):

“受众对边缘AI不了解”(平均分6.15)

“缺乏商业成功案例”(平均分6.43)


学术界(截距均值5.40):

“受众对边缘AI不了解”(平均分5.91)

“缺乏与现有方案系统对比,包括成本、部署要求”(平均分5.68)


在校学生(截距均值5.46):

“缺乏商业成功案例”(平均分6.05)

“缺乏直观的UI界面和Demo”(平均分6.05)

“缺乏与现有方案系统对比,包括成本、部署要求”(平均分5.53)

亟需改进

对于边缘AI技术布道者,问卷中提及的挑战被选为“亟需改进”的比例都在20%以上,高于“还有其他重要挑战”的1.72%,可以认为各个挑战都有一定的迫切需求。


其中被选为“亟需改进”的挑战中比例最高(32.18%)的是:

“缺乏商业成功案例”


在截尾均值(25.00%)以上的其它头部挑战还包括:

“缺乏与现有方案系统对比,包括成本、部署要求”

“缺乏直观的UI界面和DEMO”


与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。

1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值0.06),这可能说明该挑战比较重要,而且需求比较迫切。这个“重要且紧急”挑战是:

“缺乏直观的UI界面和DEMO”


2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,更为“长远”的需求。这个“重要不紧急”挑战是:

“受众对边缘AI不了解”


对于边缘AI技术布道者,问卷中提及的挑战被选为“亟需改进”的比例都在20%以上,高于“还有其他重要挑战”的1.72%,可以认为各个挑战都有一定的迫切需求。


其中被选为“亟需改进”的挑战中比例最高(32.18%)的是:

“缺乏商业成功案例”


在截尾均值(25.00%)以上的其它头部挑战还包括:

“缺乏与现有方案系统对比,包括成本、部署要求”

“缺乏直观的UI界面和DEMO”


与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。

1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值0.06),这可能说明该挑战比较重要,而且需求比较迫切。这个“重要且紧急”挑战是:

“缺乏直观的UI界面和DEMO”


2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,更为“长远”的需求。这个“重要不紧急”挑战是:

“受众对边缘AI不了解”


可改进

问卷中的绝大部分挑战都以较大比例(54.02% - 62.07%) 被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为6.89%,说明列举在问卷中相关挑战大部分都明显有改进的需求。


其中,被认为“可改进”的挑战中比例最高(62.07%)的是:

“缺乏商业成功案例”


在截尾均值(57.61%)以上的其它头部挑战还包括:

“缺乏与现有方案系统对比,包括成本、部署要求”

“受众对边缘AI不了解”


与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。

1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急,看上去更“长远”的挑战包括:

“受众对边缘AI不了解”

这与“亟需改进”章节结论一致。


2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:

“缺乏直观的UI界面和DEMO”

这与“亟需改进”章节结论一致。

小结

对边缘AI技术布道者有以下结论:

1. 平均分值最高(6.61分)的挑战是:

“缺乏商业成功案例”


2. 其它头部重要挑战中

“重要不紧急”头部重要挑战包括:

“受众对边缘AI不了解”

“重要且紧急”头部重要挑战包括:

“缺乏直观的UI界面和DEMO”

头部重要挑战还包括:

“缺乏与现有方案系统对比,包括成本、部署要求”


3. “边缘AI及其应用”方向下技术布道各职业平均分值最高的生态挑战分别是:

工业界:

“缺乏与现有方案系统对比,包括成本、部署要求” (平均分6.63)

学术界:

“缺乏商业成功案例” (平均分6.59)

在校学生:

“受众对边缘AI不了解”(平均分6.25)


问卷中也尝试调研边缘AI技术布道其余重要挑战,调研结果词云如下所示。包括边缘AI价值和方案配套等7条意见,由于篇幅原因不一一阐述。

未来工作

作为KubeEdge社区SIG AI重要成员,华为云边缘云创新实验室将依据调研结果有针对性地向KubeEdge社区SIG AI持续贡献。KubeEdge是业界首个云原生边缘计算框架、当前云原生计算基金会内部唯一孵化级边缘计算开源项目。KubeEdge在全球已拥有800+贡献者和60+贡献组织,在Github获得4.6k+Stars和1.3k+Forks。作为KubeEdge中唯一的AI特别兴趣小组(Special Interest Group),KubeEdge社区SIG AI致力于使能AI应用在边缘更好地运行,聚焦边缘AI技术讨论、API定义、参考架构、开源实现等。为全球开发者提供相关研发支持并孵化繁荣生态,当前已开源边缘AI平台Sedna,包括其跨边云的协同推理、联邦学习、增量学习和终身学习特性

作为信奉开源文化的社区,KubeEdge始终都强调“Best ideas win”,领域发展自然也不例外。为了交出一个更有竞争力和创意的提案,本次调研了解每位关注开源与边缘AI的朋友对相关方案落地过程遇到的困难,然后选取Best idea,对社区内容进行优化,以便为大家呈现一个体现开源开放精神的资源分享社区生态。

除了之前章节提及的内容,问卷中还包括调研对象的建议。其中“提供公开数据集、预处理和基线代码,构建Benchmark”的建议无论在总览、还是在边缘AI方向的工业界、学术界和在校学生中票数均排名第一,比例分别为82.18%、92.98%、87.10%、86.67%,并且显著高于其它建议,相信此建议需要重点关注。社区也可以根据上面的阐述细分相关职业需求,进一步优化边缘AI生态。


问卷也尝试调研其余重要建议。包括场景演示和研发支撑等8条建议:

场景演示

1.增加demo展示

2.深入了解行业落地痛点

3.找准一个典型领域或场景进行全方案的落地测试,包括训练和推理结合实际业务形成一套端到端的解决方案

4.光调研开发者不足够,并非方案用户,要落地还得调研边缘AI的最终客户需求


研发支撑

1.最重要还是数据公开

2.希望能提供更多的例子,示例怎么完成一个任务的训练和部署。

联邦学习目前了解的人比较少,希望对它的优势和使用方法做更多介绍,降低系统使用门槛。

3.需要对相关开源平台的了解,也可以搞合作

4.提供更多的开发者使用模式,不局限于现在example


路遥共相伴,勠力同向前。特别感谢参与答卷的专家、学者和同学,本次调研的四大“意见专家”与十佳“优秀意见”等各项评选正在有序进行,并将陆续发放报告和纪念品。

结合行业关注的最新技术趋势,KubeEdge将集结当前SIG AI中30+单位的各供应商和开发者为边缘AI算法开发者、服务开发者、技术布道者三种角色提供资源和平台帮助。这将包括数据集开源、预处理与范式算法开源、以及AI工具等行业内迫切需要的资源,为大家带来一场开源饕餮盛宴。相关内容将陆续到来!

附:贡献和技术交流地址

KubeEdge社区:https://github.com/kubeedge/

KubeEdge SIG AI及其项目Sedna:https://github.com/kubeedge/sedna