SLAM 深度学习模型时间线(2015–2026)的历史时间线

(AI时间线生成)

整理了2015年至2026年间深度学习SLAM领域的关键模型,涵盖前端特征、后端优化、回环检测、建图、端到端系统、语义/决策六大类别。

2015

PoseNet (ICCV) – 重定位:首个用 CNN 回归相机 6DoF 位姿,深度学习与 SLAM 结合的开山之作。

2016

LIFT (ECCV) – 前端特征:首个用 CNN 学习特征点+描述子以替代 SIFT,结构复杂、非端到端。

2017

DeepVO (arXiv) – 端到端系统:CNN+LSTM 端到端视觉里程计,直接从图像序列推导相机运动。

2017.12 → 2018

SuperPoint (arXiv 2017.12 → CVPR 2018) – 前端特征:自监督 CNN 特征点检测+描述,首个实用、轻量、端到端的 DL 特征点模型。

2017

CNN-SLAM (CVPR) – 建图:将 CNN 预测的深度图与直接法单目 SLAM 融合,实现实时稠密单目重建,也是深度学习深度估计与 SLAM 几何结合的早期经典。

2018

YOLOv3 – 语义/决策:实时目标检测,动态 SLAM 常用。

2018

NetVLAD (CVPR) – 回环检测:全局图像描述符,工业化部署经典。

2018

GeoNet (CVPR) – 前端特征:无监督框架联合估计单目深度、光流和相机运动,将三者通过几何一致性耦合。

2019

SuperGlue (NeurIPS) – 前端特征:Transformer+图匹配的特征匹配,精度高但较重。

2019

PointNetVLAD (ICRA) – 回环检测:点云全局描述符,激光 SLAM 常用。

2019

D2-Net (CVPR) – 前端特征:单一 CNN 同时实现稠密特征描述和特征检测的联合模型,无需额外检测步骤。

2019

GCNv2 (arXiv) – 前端特征:生成与 ORB 格式兼容的二进制描述子,可直接替换 ORB-SLAM 中的 ORB 特征,显著提升计算效率。

2020

YOLOv4 – 语义/决策:实时目标检测。

2020

DISK (ECCV) – 前端特征:端到端可微分特征点检测+描述。

2020

CALC (ICRA) – 回环检测:轻量 NetVLAD 变体,室内场景优化。

2020

D3VO (CVPR) – 端到端系统:将深度、位姿和不确定度预测紧密集成到直接法视觉里程计,同时提升前端追踪与后端非线性优化性能。

2021

LoFTR (CVPR) – 前端特征:无检测器密集匹配,低纹理场景表现强。

2021

CLIP – 语义/决策:图文对齐大模型,后续有轻量版用于 SLAM 语义理解。

2021

DINO – 建图:自监督视觉特征(DINOv1),用于语义建图中产生物体级表征。

2021

DROID-SLAM (NeurIPS) – 端到端系统:基于可微光流迭代更新的密集视觉 SLAM,成为后续端到端稠密 SLAM 的标杆。

2021

NeRF (CVPR) – 建图:神经辐射场,开启隐式表示三维场景的建图方向。

2022

Lightweight SuperPoint (arXiv) – 前端特征:SuperPoint 深度可分离卷积轻量化(0.3M 参数)。

2022

EM-LSD (ECCV) – 前端特征:轻量级线段检测,适用于结构化环境。

2022

Instant-NGP (SIGGRAPH) – 建图:极速 NeRF,为实时神经 SLAM 提供基础。

2023

LightGlue (ICCV) – 前端特征:SuperGlue 轻量化(动态退出,8 倍速)。

2023

ALIKE (ICRA) – 前端特征:SuperPoint 知识蒸馏+高效注意力。

2023

SAM (arXiv) – 语义/决策:通用分割大模型,可零样本分割任意物体。

2023

MobileSAM (arXiv) – 语义/决策:SAM 蒸馏至 1–10 MB,边缘实时部署。

2023

FastSAM (arXiv) – 语义/决策:SAM 轻量蒸馏版,实时分割速度显著优于原版。

2023

3D Gaussian Splatting (SIGGRAPH) – 建图:显式 3D 高斯散点表示,突破神经隐式方法的实时渲染瓶颈,大量用于后续稠密 SLAM 建图模块。

2023

GroundingDINO (arXiv) – 语义/决策:开放词汇检测,零样本物体识别,语义 SLAM 常用。

2023

VSO (ECCV) – 后端优化:将语义约束融入位姿和地图优化框架,通过最小化语义投影误差实现中长期的连续跟踪。

2024

SplatAM (CVPR) – 建图:首个 RGB-D 3DGS-SLAM(轮廓引导跟踪)。

2024

MonoGS (CVPR Best Demo) – 建图:单目 3DGS-SLAM,在无深度输入下实现单目稠密重建。

2024

YOLOv8–v10 – 语义/决策:实时检测+分割一体化,小模型轻量易部署,成为动态 SLAM 语义模块主力。

2024

SLAM-Former (arXiv) – 后端优化:基于 Transformer 统一前后端的模块化架构,轻量版参数仅 2M。

2024

SPAQ-DROID (arXiv) – 端到端系统:DROID-SLAM 结构化剪枝+量化,实现 79.8% 体积缩减。

2024

SAM2 (arXiv) – 语义/决策:SAM 视频版,支持时序一致性的全帧跟踪,适用于动态场景下的时序分割。

2024

ScanContext (IROS) – 回环检测:基于非直方图的 LiDAR 点云全局描述子,对 LiDAR 视角变化保持不变性,广泛用于激光 SLAM 的重定位检测。

2025

XFeat (ICRA) – 前端特征:超轻量特征(<0.5M 参数,CPU 实时)。

2025

EfficientLoFTR (ECCV) – 前端特征:LoFTR 轻量化(低纹理+速度双优)。

2025

YaPRe (RSS) – 前端特征:轻量亚像素匹配(高精度+低功耗)。

2025

OverlapMamba (ICCV) – 回环检测:Mamba 状态空间模型替换 Transformer,适用于长序列点云回环检测。

2025

TinyDepth – 前端特征:轻量级单目深度(2.1M 参数),用于单目 SLAM 初始化。

2025

SAD-Depth – 前端特征:轻量单目深度(4.5 MB),嵌入式实时集成。

2025

Splat-SLAM (CVPR) – 建图:全局优化的 RGB-only 3DGS-SLAM,无需深度传感器即可完成全局一致增量高斯建模。

2025

InfoLa-SLAM (ICRA) – 后端优化:轻量化关键帧选择(减少 75% 优化帧,误差仅 +3%)。

2026

Flash-Mono (ICLR) – 建图:单目 3DGS-SLAM 10 倍加速(RTX 3090 交互帧率)。

2026

StereoGS-SLAM (CVPR) – 建图:双目 3DGS-SLAM(无主动深度传感器)。

2026

Dy3DGS-SLAM (arXiv) – 建图:动态场景 3DGS-SLAM(贝叶斯动态掩码)。

2026

FoundationSLAM (AAAI) – 端到端系统:基础大模型驱动稠密 SLAM。

更多历史时间线