【说站】python如何判断文件夹内的重复图片
Python 如何 图片 判断 重复 文件夹
2023-06-13 09:13:22 时间
python如何判断文件夹内的重复图片
步骤
1、首先将所有的图片按照图片大小(byte)进行分类,然后再进行分类比较。
2、重复图片很有可能连续出现(因为重复图片大小相同)
如果要判断文件夹中是否有相同的图片,则需要对文件夹中的所有图片进行分类,并逐一判断两张图片是否相同。
如果文件夹中有1000张图片,则第一张图片需要与剩余的999张图片进行比较,第二张图片需要与剩余的998张图片进行比较,第三张图片需要与剩余的997张图片进行比较,以此类推。
实例
if __name__ == '__main__':
load_path = 'E:\\测试图片集(未去重)' # 要去重的文件夹
save_path = 'E:\\测试图片集(重复照片)' # 空文件夹,用于存储检测到的重复的照片
os.makedirs(save_path, exist_ok=True)
# 获取图片列表 file_map,字典{文件路径filename : 文件大小image_size}
file_map = {}
image_size = 0
# 遍历filePath下的文件、文件夹(包括子目录)
for parent, dirnames, filenames in os.walk(load_path):
# for dirname in dirnames:
# print('parent is %s, dirname is %s' % (parent, dirname))
for filename in filenames:
# print('parent is %s, filename is %s' % (parent, filename))
# print('the full name of the file is %s' % os.path.join(parent, filename))
image_size = os.path.getsize(os.path.join(parent, filename))
file_map.setdefault(os.path.join(parent, filename), image_size)
# 获取的图片列表按 文件大小image_size 排序
file_map = sorted(file_map.items(), key=lambda d: d[1], reverse=False)
file_list = []
for filename, image_size in file_map:
file_list.append(filename)
# 取出重复的图片
file_repeat = []
for currIndex, filename in enumerate(file_list):
dir_image1 = file_list[currIndex]
dir_image2 = file_list[currIndex + 1]
result = 比较两张图片是否相同(dir_image1, dir_image2)
if(result == "两张图相同"):
file_repeat.append(file_list[currIndex + 1])
print("\n相同的图片:", file_list[currIndex], file_list[currIndex + 1])
else:
print('\n不同的图片:', file_list[currIndex], file_list[currIndex + 1])
currIndex += 1
if currIndex >= len(file_list)-1:
break
# 将重复的图片移动到新的文件夹,实现对原文件夹降重
for image in file_repeat:
shutil.move(image, save_path)
print("正在移除重复照片:", image)
以上就是python判断文件夹内的重复图片的方法,希望对大家有所帮助。
相关文章
- 如何在pycharm运行python_pycharm怎么运行部分代码
- python win32api messagebox_如何在Python中使用Win32 API?
- Python多线程通信_python socket多线程
- python程序的热部署实现[通俗易懂]
- 如何用Python提取视频的某些帧并保存为图片
- 【说站】python三元操作符如何赋值
- 【说站】python字符串如何取值
- 【说站】python如何输入数据类型检查
- 【说站】python赋值运算符如何使用
- 【说站】python中异步非阻塞如何实现
- pycharm如何使用pyinstaller_python的pyinstaller用法
- pythoncharm如何改字体大小_怎么把python的字体调大
- py2exe打包多个py文件_Python导入包
- python mkv转mp4,如何将mkv格式转换成mp4视频呢
- python抛出异常写法_零基础学 Python(32):如何抛出和捕获异常?「建议收藏」
- python如何生成随机数_Python生成50个随机数
- eval在python中是什么意思_如何在Python中使用eval ?
- Python语言如何在一个单独的线程中进行快速的IO操作
- 如何使用Python批量下载图片
- opencv(4.5.3)-python(二十二)--轮廓线层次结构
- 【python实操】如何通过简单拖拽直接开发软件,避免手写界面布局
- 独家 | 别在Python中用Matplotlib和Seaborn作图了,亲,试试这个
- python-数据库编程-如何在Python中连接到数据库
- Linux系统如何运行Python脚本(linux执行python脚本)
- 开发Linux下Python编程:实现自己的开发梦想(linux下python)
- Linux下使用Python开发体验之旅(linux使用python)
- 从Python连接Oracle数据库介绍(python连接oracle)
- 使用Python连接SQL Server数据库(python连接sqlserver数据库)
- 如何判断你的 Python 代码实现是否合适?
- Python如何连接PostgreSQL数据库?(python连接postgresql)
- 如何在Linux中安装Python?(linux安装python)
- Python如何连接MySQL数据库(python怎么连接mysql数据库)
- python实现的一只从百度开始不断搜索的小爬虫
- Python中dictionaryitems()系列函数的用法实例