【传感器融合】开源 | MinkLoc++:激光雷达和单目图像融合的位置识别方法,性能SOTA!
2023-04-18 15:03:43 时间
论文地址: http://arxiv.org/pdf/2104.05327v2.pdf
来源: Warsaw University of Technology
论文名称:MinkLoc++: Lidar and Monocular Image Fusion for Place Recognition
原文作者:Jacek Komorowski
内容提要
我们提出了一个基于一对传感器读数的判别多模态描述符:一个来自激光雷达的点云和一个来自RGB相机的图像。描述符名为MinkLoc++,可以用于机器人或自动驾驶汽车应用程序中的位置识别、重新定位和环路闭合。我们使用晚期融合方法,其中每个模态被单独处理,并在处理步骤的最后部分融合。该方法在标准位置识别基准上实现了最先进的性能。在训练多模态描述符时,我们也发现了支配态问题。当网络聚焦于对训练数据有较大过拟合的模态时,问题就会显现出来。这会在训练期间降低损失,但会导致评估集中的表现不佳。在这项工作中,我们描述了如何检测和减轻这种风险,使用深度度量学习方法训练多模态神经网络。
主要框架及实验结果
声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请加上文微信联系删除。
相关文章
- 【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
- CLB运维&运营最佳实践 ---访问日志大洞察
- vnc方式登陆服务器
- 轻松学排序算法:眼睛直观感受几种常用排序算法
- 十二个经典的大数据项目
- 为什么使用 CDN 内容分发网络?
- 大数据——大数据默认端口号列表
- Weld 1.1.5.Final,JSR-299 的框架
- JavaFX 2012:彻底开源
- 提升as3程序性能的十大要点
- 通过凸面几何学进行独立于边际的在线多类学习
- 利用行动影响的规律性和部分已知的模型进行离线强化学习
- ModelLight:基于模型的交通信号控制的元强化学习
- 浅谈Visual Source Safe项目分支
- 基于先验知识的递归卡尔曼滤波的代理人联合状态和输入估计
- 结合网络结构和非线性恢复来提高声誉评估的性能
- 最佳实践丨云开发CloudBase多环境管理实践
- TimeVAE:用于生成多变量时间序列的变异自动编码器
- 具有线性阈值激活的神经网络:结构和算法
- 内网渗透之横向移动 -- 从域外向域内进行密码喷洒攻击