SLAM 深度学习模型时间线(2015–2026)的历史时间线
(AI时间线生成)
整理了2015年至2026年间深度学习SLAM领域的关键模型,涵盖前端特征、后端优化、回环检测、建图、端到端系统、语义/决策六大类别。
2015
PoseNet (ICCV) – 重定位:首个用 CNN 回归相机 6DoF 位姿,深度学习与 SLAM 结合的开山之作。
2016
LIFT (ECCV) – 前端特征:首个用 CNN 学习特征点+描述子以替代 SIFT,结构复杂、非端到端。
2017
DeepVO (arXiv) – 端到端系统:CNN+LSTM 端到端视觉里程计,直接从图像序列推导相机运动。
2017.12 → 2018
SuperPoint (arXiv 2017.12 → CVPR 2018) – 前端特征:自监督 CNN 特征点检测+描述,首个实用、轻量、端到端的 DL 特征点模型。
2017
CNN-SLAM (CVPR) – 建图:将 CNN 预测的深度图与直接法单目 SLAM 融合,实现实时稠密单目重建,也是深度学习深度估计与 SLAM 几何结合的早期经典。
2018
YOLOv3 – 语义/决策:实时目标检测,动态 SLAM 常用。
2018
NetVLAD (CVPR) – 回环检测:全局图像描述符,工业化部署经典。
2018
GeoNet (CVPR) – 前端特征:无监督框架联合估计单目深度、光流和相机运动,将三者通过几何一致性耦合。
2019
SuperGlue (NeurIPS) – 前端特征:Transformer+图匹配的特征匹配,精度高但较重。
2019
PointNetVLAD (ICRA) – 回环检测:点云全局描述符,激光 SLAM 常用。
2019
D2-Net (CVPR) – 前端特征:单一 CNN 同时实现稠密特征描述和特征检测的联合模型,无需额外检测步骤。
2019
GCNv2 (arXiv) – 前端特征:生成与 ORB 格式兼容的二进制描述子,可直接替换 ORB-SLAM 中的 ORB 特征,显著提升计算效率。
2020
YOLOv4 – 语义/决策:实时目标检测。
2020
DISK (ECCV) – 前端特征:端到端可微分特征点检测+描述。
2020
CALC (ICRA) – 回环检测:轻量 NetVLAD 变体,室内场景优化。
2020
D3VO (CVPR) – 端到端系统:将深度、位姿和不确定度预测紧密集成到直接法视觉里程计,同时提升前端追踪与后端非线性优化性能。
2021
LoFTR (CVPR) – 前端特征:无检测器密集匹配,低纹理场景表现强。
2021
CLIP – 语义/决策:图文对齐大模型,后续有轻量版用于 SLAM 语义理解。
2021
DINO – 建图:自监督视觉特征(DINOv1),用于语义建图中产生物体级表征。
2021
DROID-SLAM (NeurIPS) – 端到端系统:基于可微光流迭代更新的密集视觉 SLAM,成为后续端到端稠密 SLAM 的标杆。
2021
NeRF (CVPR) – 建图:神经辐射场,开启隐式表示三维场景的建图方向。
2022
Lightweight SuperPoint (arXiv) – 前端特征:SuperPoint 深度可分离卷积轻量化(0.3M 参数)。
2022
EM-LSD (ECCV) – 前端特征:轻量级线段检测,适用于结构化环境。
2022
Instant-NGP (SIGGRAPH) – 建图:极速 NeRF,为实时神经 SLAM 提供基础。
2023
LightGlue (ICCV) – 前端特征:SuperGlue 轻量化(动态退出,8 倍速)。
2023
ALIKE (ICRA) – 前端特征:SuperPoint 知识蒸馏+高效注意力。
2023
SAM (arXiv) – 语义/决策:通用分割大模型,可零样本分割任意物体。
2023
MobileSAM (arXiv) – 语义/决策:SAM 蒸馏至 1–10 MB,边缘实时部署。
2023
FastSAM (arXiv) – 语义/决策:SAM 轻量蒸馏版,实时分割速度显著优于原版。
2023
3D Gaussian Splatting (SIGGRAPH) – 建图:显式 3D 高斯散点表示,突破神经隐式方法的实时渲染瓶颈,大量用于后续稠密 SLAM 建图模块。
2023
GroundingDINO (arXiv) – 语义/决策:开放词汇检测,零样本物体识别,语义 SLAM 常用。
2023
VSO (ECCV) – 后端优化:将语义约束融入位姿和地图优化框架,通过最小化语义投影误差实现中长期的连续跟踪。
2024
SplatAM (CVPR) – 建图:首个 RGB-D 3DGS-SLAM(轮廓引导跟踪)。
2024
MonoGS (CVPR Best Demo) – 建图:单目 3DGS-SLAM,在无深度输入下实现单目稠密重建。
2024
YOLOv8–v10 – 语义/决策:实时检测+分割一体化,小模型轻量易部署,成为动态 SLAM 语义模块主力。
2024
SLAM-Former (arXiv) – 后端优化:基于 Transformer 统一前后端的模块化架构,轻量版参数仅 2M。
2024
SPAQ-DROID (arXiv) – 端到端系统:DROID-SLAM 结构化剪枝+量化,实现 79.8% 体积缩减。
2024
SAM2 (arXiv) – 语义/决策:SAM 视频版,支持时序一致性的全帧跟踪,适用于动态场景下的时序分割。
2024
ScanContext (IROS) – 回环检测:基于非直方图的 LiDAR 点云全局描述子,对 LiDAR 视角变化保持不变性,广泛用于激光 SLAM 的重定位检测。
2025
XFeat (ICRA) – 前端特征:超轻量特征(<0.5M 参数,CPU 实时)。
2025
EfficientLoFTR (ECCV) – 前端特征:LoFTR 轻量化(低纹理+速度双优)。
2025
YaPRe (RSS) – 前端特征:轻量亚像素匹配(高精度+低功耗)。
2025
OverlapMamba (ICCV) – 回环检测:Mamba 状态空间模型替换 Transformer,适用于长序列点云回环检测。
2025
TinyDepth – 前端特征:轻量级单目深度(2.1M 参数),用于单目 SLAM 初始化。
2025
SAD-Depth – 前端特征:轻量单目深度(4.5 MB),嵌入式实时集成。
2025
Splat-SLAM (CVPR) – 建图:全局优化的 RGB-only 3DGS-SLAM,无需深度传感器即可完成全局一致增量高斯建模。
2025
InfoLa-SLAM (ICRA) – 后端优化:轻量化关键帧选择(减少 75% 优化帧,误差仅 +3%)。
2026
Flash-Mono (ICLR) – 建图:单目 3DGS-SLAM 10 倍加速(RTX 3090 交互帧率)。
2026
StereoGS-SLAM (CVPR) – 建图:双目 3DGS-SLAM(无主动深度传感器)。
2026
Dy3DGS-SLAM (arXiv) – 建图:动态场景 3DGS-SLAM(贝叶斯动态掩码)。
2026
FoundationSLAM (AAAI) – 端到端系统:基础大模型驱动稠密 SLAM。
AI时间线