记录使用yolov5进行旋转目标的检测
由于实习公司需要使用到旋转目标的检测,所以这几天学习了相关知识,并找了许多资料,饶了许多的弯路。下面记录下项目的整个实现过程。
我参考的是以下几位博主:
DOTAv2遥感图像旋转目标检测竞赛经验分享(Swin Transformer + Anchor free/based方案) - 知乎
首先,先为该项目创建一个虚拟环境
VS2015
pytorch 1.6.0(其他版本也可以进行尝试)
torchvision 0.7.0(其他版本也可以进行尝试)
其中这个VS2015,17,19版本都可以,但是pytorch和torchvision必须是要求的版本 ,不然可能会出错 这里试了torch1.8.1和torchvision0.9.1是可以用的。建议安装pytorch和torchvision时采用离线安装包安装,比较稳定。地址,
https://download.pytorch.org/whl/torch_stable.html
接着打开Anaconda prompt创建项目的虚拟环境
conda create -n royolov5 python=3.8
conda activate yolov5
进入创建的虚拟环境之后cd进入下载好pytorch和torchvision的文件夹。然后执行
pip install torch-1.6.0+cu101-cp38-cp38-win_amd64.whl
pip install torchvision-0.7.0+cu101-cp38-cp38-win_amd64.whl
这里注意后缀名.whl不要忘了。
到这里,就将pytorch框架搭好了。
接着,下载我发的压缩包,解压后,同样cd进入YOLOv5_DOTA_OBB-master项目文件的主目录
执行 pip install -r requirements.txt 安装相关的包。
再,添加E:PytorchProYOLOv5_DOTA_OBB-masterswigwin-4.0.2到path里面,这里要进行系统环境的刷新,可以选择重启,也可以进入cmd,输入set path=c 进行刷新
再,在Anaconda prompt中的royolov5环境下cd进入utils分别运行
swig -c++ -python polyiou.i
python setup.py build_ext --inplace
再,将E:ProgramDataAnaconda3envs oyolov5Libsite-packagesshapelyDLLs所有dll复制到E:ProgramDataAnaconda3envs oyolov5Libraryin
到这一步,训练环境基本准备好了,下面开始准备旋转目标所需的数据集
首先要使用到rolabelimg旋转目标标注工具,具体怎么使用自行百度。下载地址
https://github.com/cgvict/roLabelImg
标注图像后得到的是xml格式,这里需要对数据格式进行转换,符合yolov5的txt格式
首先,运行roxml_to_data.py,转换到Dota的8点数据格式
再将图像数据依次放在以下文件夹
其中images里存放原图像,labelTxt中存放上一步转化的8点格式txt文件(注意要和images中的图像文件对应)
再,进入DOTA_devkit_YOLO-master,修改DOTA_devkit_YOLO-masterdota_utils.py中的classnames_v1_5,修改为你标注数据的种类
再,分别运行PaddingPIC.py和YOLO_Transform.py
其中,PaddingPIC.py的作用是将图片扩展到高宽相同,便于数据处理。YOLO_Transform.py的作用是将dota的数据格式转换为yolov5的数据格式。
转换后的txt文件会存放再yolo_labels文件夹中
再,将yolov5训练所需的原图像和上一步操作得到的txt文件分别放入DOTA_demo_view文件夹里的images和labels中
再修改dataDOTA_ROTATED.yaml中nc和names,或者自己写个yaml文件
可以再修改下网络模型的yaml文件,不会的话用官方的yaml文件就行
最后别忘了下载权重文件,这里要注意,因为这个项目是基于v5-3.1版本的,所以,下载的权重文件不能下载最新的pt文件,不然会报错。
最后,开始训练就可以了。
给出资源链接:
【超级会员V3】通过百度网盘分享的文件:JLJ.zip
链接:https://pan.baidu.com/s/17zVi6ae6sSs3ab7cUiWhig
提取码:8e3g
相关文章
- idea软件mapper标签中namespace属性自定义名称爆红处理
- 联合索引-最左匹配原则
- 常用操作
- 计讯物联边缘计算网关TG452,是充电桩远程监控方案的最佳助攻
- 4万字c++讲解+区分c和c++,不来可惜了(含代码+解析)
- 100天精通Python(可视化篇)——第79天:matplotlib绘制不同种类炫酷折线图代码实战(网格、趋势、对比、百分比、多条折线、堆积、百分比堆积、多坐标子图、3D折线图)
- 转:numpy中expand_dims()函数详解
- chatPDF学习 embedding
- tryhackme_nmap
- python--matplotlib(4)
- 第5章 挖掘建模之离群点检测
- YOLOv7(目标检测)入门教程详解---检测,推理,训练
- ==和equals的区别
- sql语句查询重复的数据
- 一天吃透MySQL锁面试八股文
- 基于STM32的OLED多级菜单GUI实现(简化版智能手表)
- 如何规避MyBatis使用过程中带来的全表更新风险
- django+vue_day13_14_15
- 链表基础知识详解(非常详细简单易懂)
- MySQL数据操作命令,脱裤可能用到哦