GitHub趋势榜第一:超强PyTorch目标检测库Detectron2,5天3100星
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
第一:超强PyTorch目标检测库Detectron2,5天3100星">
PyTorch目标检测库Detectron2诞生了,Facebook出品。
第一:超强PyTorch目标检测库Detectron2,5天3100星" style="text-align: center;">
站在初代的肩膀上,它训练比从前更快,功能比从前更全,支持的模型也比从前更丰盛。
开源5天,已在GitHub收获3100星,还成了趋势榜第一:
![GitHub趋势榜<span><span><span><i style=](https://s5.51cto.com/oss/201910/17/37bbdb544b50d45cac023f24fee77440.jpg)
除此之外,团队把大规模姿态估计算法DensePose,做出了基于Detectron2的新版本。
Facebook说,像DensePose一样,今后会有更多研究项目,在Detectron2上搭建起来。
这样,就可以把它当成一个广泛支持各种研究工作的库了。
那么,现在就来仔细观察一下,Detectron2都发生了哪些进化:
全方位升级
![GitHub趋势榜<span><span><span><i style=](https://s2.51cto.com/oss/201910/17/8833939504dd50f589f42e2536797fb6.jpg)
首先,Detectron2比起初代,最明显的变化是:
基于PyTorch了,初代还是在Caffe2里实现的。
团队说,PyTorch有直观的指令式编程,这样就能更快地迭代模型设计和实验。
Detectron2是在PyTorch里从零开始写成的,团队希望这种做法,能让用户享受PyTorch做深度学习的思路。社区更活跃的话,PyTorch也会变得更好。
第二个变化,是模块化了。
所谓模块化,就是用户可以把自己定制的模块实现,加到一个目标检测系统的任何部分里去。
这意味着许多的新研究,都能用几百行代码写成,并且可以把新实现的部分,跟核心Detectron2库完全分开。
除此之外,还有许多新支持的模型、功能和任务:
新模型&新功能
首先,Detectron2包含了一代可用的所有模型:
比如Faster R-CNN,Mask R-CNN,RetinaNet,DensePose等等。
![GitHub趋势榜<span><span><span><i style=](https://s2.51cto.com/oss/201910/17/15465573918b764099bc881b935dc6ba.jpg)
然后,加入了一些新模型:
比如Cascade R-NN,Panoptic FPN,以及TensorMask。
今后,陆续会有新的算法支持。
功能方面,二代新支持了同步批量归一化 (synchronous Batch Norm) ,也支持了LVIS等等许多新的数据集。
新任务
和目标检测有关的任务,初代已经支持了一部分,二代也都支持:
有边界框的目标检测,实例分割mask,以及人类姿态预测。
![GitHub趋势榜<span><span><span><i style=](https://s3.51cto.com/oss/201910/17/52a2bad1209df0a26618d3fdab9df796.jpg)
在这基础之上,二代又增加了新任务:
语义分割和全景分割 (Panoptic Segmentation) ,这是一个把语义分割和实例分割结合到一起的任务。
速度快
博客提到,由于把整个训练pipeline移到了GPU上,二代比初代更快了,在许多模型上都是如此。分布式训练,让几台GPU一起跑的话,还可以把训练规模扩张到更大的数据集上。
速度的对比,是用第100-500次迭代之间的平均吞吐量 (Average Throughput) 作为指标。这样就跳过了GPU预热时间。结果如下:
![GitHub趋势榜<span><span><span><i style=](https://s5.51cto.com/oss/201910/17/03c619aff65c212c020bc5a0aef281f0.jpg)
肉眼可见的加速。
注意,对于R-CNN这类模型,一个模型的吞吐量会随着训练的进行而变化,这取决于模型的预测。
因此,这个指标也不能和model zoo里的“训练速度”相提并论。model zoo用的是整个训练过程运行的平均速度。
部署一下
最后,Facebook的计算机视觉攻城狮们,实现了一个额外的软件层,叫Detectron2go。
有了它,就可以更快地把新实现的模型,部署到生产环节。
这一层的功能包括了标准训练工作流,带有内部数据集,网络量化,以及模型转化 (为了给云端和移动端部署,选择各自最优的格式) 。
相关文章
- 如何监控流服务
- 沙漠种树机器人、健身洗衣机 00后“何同学们”脑洞大开
- 用 Encore 进行视频转码
- Android DataBinding 从入门到进阶,看这一篇就够
- 人民日报:促进算法推荐技术规范健康发展
- Meta开发AI超级计算机 也许能成为世界最快
- 我从非科班到大厂,这5点思维转变最为重要!
- 用于实时 3D 重建的深度和法线的高速同测量
- Stylevision:基于 WebRTC、FFmpeg、Tensorflow 的实时风格变换
- 网站快照被攻击收录大量垃圾内容
- 删库跑路大神「后悔」了?我只不过犯了大家都会犯的编程错误!
- 芯片后仿及SDF反标
- 微软 687 亿美元收购动视暴雪、字节跳动回应裁撤投资业务、苹果接受台积电涨价
- 卷爆了 | 看SPViT把Transformer结构剪成ResNet结构!!!
- 这个AI能帮你快速搜监控:文字定位关键帧,24小时录像10分钟处理
- 开源项目PolarisMesh月报:发布V 1.3.0 ,完美支持 proxyless 和 proxy 两种服务网格模式
- KDD 2021 | 大规模安全稀疏逻辑回归提速隐私计算
- Gartner:2022年中国IT支出预计将增长7.89%
- 使用因果推理的人工智能保证:在公共政策中的应用(CS)
- 集体离散优化作为判断聚合(CS)