您现在的位置是：首页 > 云平台

当前栏目

OCR识别，tesseract模块安装

识别安装模块 OCR Tesseract

2023-09-27 14:26:27 时间

下载

https://digi.bib.uni-mannheim.de/tesseract/

github地址：https://github.com/UB-Mannheim/tesseract

下载地址截图

在这里插入图片描述

安装

双击程序运行

一般直接点默认即可

注意语言的添加和路径的更改

注意这一步可以选择自己语言，这里勾选简体中文
（这里不选的话可以点击上面github网址，在里面进行下载并放在相应的路径即可）

在这里插入图片描述

更改安装路径

在这里插入图片描述

设置环境变量

系统变量中找到path，点击编辑，里面加入刚刚安装的路径
在这里插入图片描述

检测安装效果

在cmd中输入tesseract -v检测是否安装成功

在这里插入图片描述
在cmd中输入tesseract --list-langs查看安装的语言

在这里插入图片描述

小案例说明

命令行实现

命令行输入 tesseract test.png result -l chi_sim

其中-l chi_sim代表要识别中文

在这里插入图片描述

python代码实现

先在对应的环境下安装包

pip install pytesseract

在这里插入图片描述
安装完之后找到安装环境目录下面的 pytesseract.py 文件
我这边直接在pycharm中查找更改，点击External Libraries->site-pactages->pytesseract->pysseract.pu

代码

import pytesseract
from PIL import Image


def demo():
    # 打开要识别的图片
    image = Image.open('test.png')
    # 调用image_to_string方法进行识别，
    # 传入要识别的图片，lang='chi_sim'是设置为中文识别
    text = pytesseract.image_to_string(image, lang='chi_sim')

    # 输入所识别的文字
    print(text)


if __name__ == '__main__':
    demo()

结果

在这里插入图片描述

在py中竟然识别错误，cmd命令识别正确Σ(⊙▽⊙"a

猜你喜欢

淘东电商项目（31） -SSO单点登录（XXL-SSO案例）
c语言_文件操作_FILE结构体解释_涉及对操作系统文件FCB操作的解释_
Leetcode: String to Integer
42、【链表】静态单链表（C/C++版）
分布式系列教程（10） -分布式协调工具Zookeeper（负载均衡原理实现）
python 多进程
《JavaScript高效图形编程（修订版）》——6.4 画布与SVG的对比
实习证明| 大数据在线实习项目意义
Simulink 环境基础知识（一）--软件启动方法
Django 博客开发教程 8 - 博客文章详情页
面试官：Zookeeper是什么，它有什么特性与使用场景？
《云数据管理：挑战与机遇》分布式数据管理
The "Go" Learning Trip -- 2. Go Basics -- Part1-2
《精通 ASP.NET MVC 4》----2.5 小结
java 读取txt按某字符拆分修改内容
UVaLive 7370 Classy (排序，比较)
C/C++ 组合的输出
诺基亚携手Facebook打破海底光缆容量吉尼斯纪录
装饰模式
分布式系统设计之常见的负载均衡算法

相关主题

Python 语音识别
识别验证码
手势识别
身份证识别
python安装，pycharm安装
python安装、pycharm安装
用Python识别验证码
点文字识别
中文识别

zl程序教程

当前栏目

OCR识别，tesseract模块安装

下载

安装

设置环境变量

检测安装效果

小案例说明

命令行实现

python代码实现

代码

结果

相关文章