【第44篇】DBNet:具有可微分二值化的实时场景文本检测
实时 检测 场景 文本 具有 44 二值化 微分
2023-09-14 09:05:41 时间
摘要
最近,基于分割的方法在场景文本检测中非常流行,因为分割结果可以更准确地描述曲线文本等各种形状的场景文本。然而,二值化的后处理对于基于分割的检测至关重要,它将分割方法产生的概率图转换为文本的边界框/区域。在本文中,我们提出了一个名为Differential Binarization (DB) 的模块,它可以在分割网络中执行二值化过程。与 DB 模块一起优化后,分割网络可以自适应地设置二值化阈值,这不仅简化了后处理,但也提高了文本检测的性能。基于一个简单的分割网络,我们在五个基准数据集上验证了 DB 的性能改进,在检测精度和速度方面始终达到最先进的结果。特别是,对于轻量级主干,DB 的性能改进是显着的,因此我们可以在检测精度之间寻找理想的权衡和效率。具体来说,借助 ResNet-18 的主干,我们的检测器在 MSRA-TD500 数据集上实现了 82.8 的 F-measure,以 62 FPS 的速度运行。代码位于:https://github.com/MhLiao/DB。
一、介绍
近年来,场景图像中的文本阅读因其在图像/视频理解、视觉搜索、自动驾驶、盲人辅助等方面的广泛实际应用而成为一个活跃的研究领域。
作为场景文本阅读的关键组成部分,旨在定位每个文本实例的边界框或区域的场景文本检测仍然是一项具有挑战性的任务,因为场景文本通常具有各种比例和形状,包括水平、多向和弯曲文本。基于分割的场景文本检测最近引起了很多关注,因为它可以描述各种形状的文本,这得益于其在像素级的预测结果。然而,大多
相关文章
- WebSocket异步通讯,实时返回数据实例
- vscode安装插件实时预览live server
- EasyNVR RTSP转RTMP-HLS流媒体服务器前端构建之:通过接口获取实时信息
- 【STM32F429的DSP教程】第49章 STM32F429的自适应滤波器实现,无需Matlab生成系数(支持实时滤波)
- 【STM32F407的DSP教程】第47章 STM32F407的IIR带阻滤波器实现(支持逐个数据的实时滤波)
- 【目标检测】54、YOLO v7 | 又是 Alexey AB 大神!专为实时目标检测设计
- 音视频实时渲染流程操作复杂吗,如何实现?
- 【IoT最佳实践】设备获取实时天气DEMO代码解读
- 用Python快速实现实时人脸活体检测
- Windows下实时检测计算机联网状态
- Jetson AGX Xavier实现TensorRT加速YOLOv5进行实时检测
- LabVIEW项目中实时目标出现黄色感叹号
- Android实时打印kernel和App log(七十一)
- 写给小白的实时音视频技术入门提纲
- VC++实时检测耳机的插入与拔出(附源码)
- 电动汽车逆变器和电机的实时效率测量
- 揭秘FaceBook Puma演变及发展——FaceBook公司的实时数据分析平台是建立在Hadoop 和Hive的基础之上,这个根能立稳吗?hive又是sql的Map reduce任务拆分,底层还是依赖hbase和hdfs存储
- python实时打哈欠检测
- 如何在高版本谷歌Chrome浏览器中用VLC播放海康、大华RTSP实时视频?
- 【目标检测论文解读复现NO.26】基于改进YOLOv5s网络的实时输液监测
- FPGA 20个例程篇:19.OV7725摄像头实时采集送HDMI显示(一)