2024年1月30日

IAC Lab 刘凌峰论文被机器学习领域顶级学术会议ICLR2024 接收

IACLAB 成员刘凌峰的论文”LUM-ViT: Learnable Under-sampling Mask Vision Transformer for Bandwidth Limited Optical Signal Acquisition”被机器学习领域顶级国际会议ICLR 2024 接收。ICLR (International Conference on Learning Representations)是全球三大机器学习顶级会议之一,与NeurlPS和ICML并列。ICLR是《 清华大学计算机学科群推荐学术会议和期刊列表》推荐的 A 类国际会议(TH-CPL A),同时也是《中国人工智能学会推荐国际学术会议和国际/国内期刊目录》推荐的 A 类国际会议(CAAI-A),在国内机器学习和人工智能领域的认可度极高。今年,该会议共收到7304篇投稿,最终收录2261 篇,接收率仅为31%。

该论文提出了一种用于提升高光谱实时检测性能的欠采样方法,开创性地将深度学习方法应用在了此任务上,实现了对传统方法数量级提升的理想效果。该方法的核心是LUM-ViT(模型结构如图1所示),一种ViT模型变体,其独特地结合了一个为采样前调制涉及的可学习欠采样掩码。为优化光学计算,该论文还提出了一种卷积核级权重二值化方法和三阶段微调策略。实验结果表明,在10%欠采样的情况下(即将采样速度提升10倍),LUM-ViT能在ImageNet分类任务中保持1.8%以内的准确率损失。该方法已通过实际硬件检测,证明了其实际可行性。

论文链接:https://openreview.net/forum?id=wkbeqr5XhC

图1 LUM-ViT 模型结构