tf识别非固定长度图片ocr(数字+字母 n位长度可变)- CNN+RNN+CTC
识别 图片 数字 长度 固定 字母 CNN TF
2023-09-14 08:57:46 时间
先安装必须的库
tensorflow_gpu==1.15.0 numpy opencv_python
github:
https://github.com/bai-shang/crnn_ctc_ocr_tf
下载数据集:
http://www.robots.ox.ac.uk/~vgg/data/text/mjsynth.tar.gz
要10G
然后解压缩,估计完整解压完需要1天
find ./mnt/ | xargs ls -d | grep jpg > image_list_all.txt # use some of data to train and eval cat image_list_all.txt | head -n 1000 > image_list.txt
这个文件的图片txt将会作为输入,然后生成tfrecord
python create_synth90k_tfrecord.py --image_dir C:\Users\McKay\PycharmProjects\test8\tfdemo\data --anno_file ./image_list.txt --char_map_json_file ../char_map/char_map.json
然后就是训练了
参数:
--data_dir ../data/tfrecords/ --model_dir ./model/ --batch_size 32 --char_map_json_file ../char_map/char_map.json
没有GPU,训练了4个小时,也只是7%的正确率
果断中断,有缘再用GPU训练。
相关文章
- PHP百度AI的OCR图片文字识别
- 【语音识别】Microsoft Speech Platform 自学笔记2 环境要求与安装过程
- PHP图片识别成文字
- 【ANDROID游戏开发十六】ANDROID GESTURE之【触摸屏手势识别】操作!利用触摸屏手势实现一个简单切换图片的功能!
- python实现百度OCR图片识别
- 微软牛津计划介绍——屌爆了的自然数据处理解决方案(人脸/语音识别,计算机视觉与语言理解)
- Atitit java 二维码识别 图片识别
- Dataset之MNIST:MNIST(手写数字图片识别+ubyte.gz文件)数据集的下载(基于python语言根据爬虫技术自动下载MNIST数据集)
- CV之IC之VGG16:基于Keras框架利用卷积神经网络VGG16算法的迁移技术实现猫狗分类识别(图片数据增强→保存h5模型)案例训练过程记录
- ML之SVM:利用SVM算法对手写数字图片识别数据集(PCA降维处理)进行预测并评估模型(两种算法)性能
- TF之LoR:基于tensorflow利用逻辑回归算LoR法实现手写数字图片识别提高准确率
- ML之SVM:基于SVM(支持向量机)之SVC算法对手写数字图片识别进行预测
- DL之NN:利用(本地数据集50000张数据集)调用自定义神经网络network.py实现手写数字图片识别94%准确率
- DL之CNN:基于CRNN_OCR算法(keras,CNN+RNN)利用数据集(torch,mdb格式)训练来实现新图片上不定长度字符串进行识别—训练过程
- TF:利用是Softmax回归+GD算法实现MNIST手写数字图片识别(10000张图片测试得到的准确率为92%)
- TF:基于CNN(2+1)实现MNIST手写数字图片识别准确率提高到99%
- TF之CNN:利用sklearn(自带手写数字图片识别数据集)使用dropout解决学习中overfitting的问题+Tensorboard显示变化曲线
- Dataset之MNIST:MNIST(手写数字图片识别+csv文件)数据集简介、下载、使用方法之详细攻略
- Dataset之Handwritten Digits:Handwritten Digits(手写数字图片识别)数据集简介、安装、使用方法之详细攻略
- 针对纯文本文字识别(ocr)根本无需文本检测
- 【Android Gradle 插件】自定义 Gradle 插件优化图片 ③ ( 识别 png 图片中的 alpha 通道信息 | png 图片的 IHDR 类型数据块 )
- 命名实体识别,使用pyltp提取文本中的地址
- 行人重识别02-06:fast-reid(BoT)-pytorch编程规范(fast-reid为例)3-迭代器构建,数据加载-1