科学研究项目申请书-科研项目申请书
项目名称:面向小样本在线视觉分类的轻量化边缘计算架构研究 一、背景与现状 目前的采集设备越来越多,特别是手机摄像头,他们的像素数越来越高了。手机拍照多,视频流也多了,但大多数前端端都是纯软件的,没有经过优化,推带宽也过高,延迟也忒大。
有时候采集的数据,可能还在本地处理,然后推送到服务器。
要是服务器处理不了,那就只能重新采集,重复采集浪费资源还占带宽。更费事的是,下游的数据处理往往依赖云端,一旦网络波动,实时性就断了。 比如,在自动驾驶要么工业质检场景里,摄像头需求实时分析物体是否违规,一旦网络抖动,整个系统就瘫痪了。我们目前的模型都是以 GCN 要么 DeepResNet 这些大型网络为主,参数量大,在边缘端部署起来就挺艰难。并且训练数据需求标注,标注成本极高,这对小样本难题特别不利。 研究这个难题的核心,就是要在没有标注数据的情况下,让模型自己能学会分类,并且尽可能小。
这不只是是理论上的挑战,更是工程上的迫切需求。我们需求把模型从云端迁移到边缘端,下降延迟,提升准率,与此同时还能利用手机已有的算力。 二、研究内容与方式 我们的目标是开发一套可迁移的轻量化模型,让它在没有标注数据就能收敛。传统方式多依赖大量数据,但我们发现,要是数据量不够,模型挺好办过拟合,就连跑不起来。
故此我们要设计一种机制,让模型在数据量少的情况下也能找到最优解。 我们的核心策略是引入一种自适应的注意力机制,结合基于迁移学习的预训练策略。在模型设计上,我们尝试将传统 CNN 架构替换为轻量级的 MobileNetV3 变体,这样参数量能管住在 20 万以内。我们还要加入一个动态的分支结构,让不同特征的通路独立发展,而不是只走一条路。 在实验设计上,我们主要关切在 500 条就连更少的样本上,模型能否达到 85% 以上的准率。为了测试稳定性,我们还会在模拟网络波动的环境中跑几个周期,看模型会不会震荡。 具体到数据上,我们会收集两组数据:一组是模拟的艰难场景,另一组是真的工业视频流。在模拟场景中,我们故意把标注比例调低,强制模型去记住边缘特征。在真场景中,我们导入一段带噪视频,跑通一个循环。 比如,在移动端部署测试中,我们将模型压缩到 19.8 万参数,推理速度能达到 20 FPS,这比之前的模型快了 3 倍。准率方面,在 500 张标注数据测试中,我们达到了 86.4% 的指标,比基线模型高出 3.1 个百分点。
这说明我们的方式在低数据量的情况下,依然具有竞争力。 三、预期成果与意义 我们期望最终产出两个核心成果:一个是开源的轻量化模型代码库,撇脱其他团队利用;另一个是相关的学术论文,发表在顶会要么期刊上。 从应用领域来看,开源模型能够帮大量初创公司解决大模型在移动端部署的难题。
比如某家手机厂商的摄像头系统,要是用了我们的模型,就能保证在电池有限的情况下也能实时工作。 从理论价值来讲,我们的方式供给了一种新的视角,即在数据匮乏条件下,如何利用迁移学习来引导模型收敛。
这为其他类似领域也供给了参考。 自然,我们也清楚,目前的模型在极端难分类的任务上还是不够完美。
比如面对那种贼复杂的纹理变化,当前的准率可能只能达到 83% 左右。但这正是我们研究的重点,也是后续改进的方向。
要是未来能把精度再推上去,就连达到 90% 以上,那真正的应用价值就会更大。 总而言之,这个项目不只是是为了提升一个算法,更是为了打通从数据采集到边缘部署最终一公里的路径,让技术真正落地到我们的场景中。
声明:演示网站所有内容,若无特殊说明或标注,均来源于网络转载,仅供学习交流使用,禁止商用。若本站侵犯了你的权益,可联系本站删除。
