您现在的位置是：首页 > 云平台

当前栏目

AI--调用百度OCR文字识别API进行图片文字识别

识别百度 AI API -- 进行图片调用

2023-09-11 14:16:24 时间

1 OCR文字识别

百度文字识别OCR提供多场景、多语种、高精度的文字检测与识别服务，多项ICDAR指标居世界第一。广泛适用于远程身份认证、文档电子化、金融保险、法律政务、财税报销、快递物流、交通出行、教育培训等场景，让应用看图识字，提升输入效率，优化用户体验，为企业降本增效。

2 如何调用

2.1 创建应用

在百度智能云控制台创建一个应用
每个应用都有产生独有的AppID、API Key、Secret Key
在这里插入图片描述

2.2 安装baidu-aip

pip install baidu-aip -i https://pypi.tuna.tsinghua.edu.cn/simple/

在这里插入图片描述

2.3 代码示例

#!/usr/bin/env python
# *_* coding :UTF-8 *_*
import os
from aip import AipOcr

# 定义常量, 自己申请的应用信息
APP_ID = '24751112'  # AppID
API_KEY = '497yL879Wa0QjIp65o04qfzn'  # API Key
SECRET_KEY = 'jgB76yC6hVSqqoFp34HgQRYFgGT2Zh0T'  # Secret Key

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)  # 初始化AipFace对象

path = "F:/tmp/pics"  # 读取图片
all_picture_path = os.listdir(path)  # 统计文件下图片个数
file = open("F:/tmp/orc_info.txt", 'w', encoding='utf-8')  # 打开你一会需要把信息写入的文件

def get_file_content(picture_path):
    with open(picture_path, 'rb') as fp:
        return fp.read()

options = {"language_type": "CHN_ENG", "detect_direction": "true", "detect_language": "true", "probability": "true"}

# 迭代识别文件下的所有图片
for path in all_picture_path:
    picture_path = os.path.join('F:', 'tmp', 'pics', path)
    print(picture_path)

    result = client.basicGeneral(get_file_content(picture_path), options)  # 接收aip返回的识别结果
    reg_res = "识别结果:\n"
    print(result)
    if 'words_result' in result:
        for seg in result['words_result']:
            reg_res += seg['words']
        file.write(picture_path + "\n")
        file.write(reg_res + "\n")
file.close()

可以根据实际情况，调用不同的方法，进行文字识别
在这里插入图片描述

参考

文字识别 OCR
文字识别 API
sdk下载

猜你喜欢

HTML中<input>參数，以及文本输入框，文本域的解说
面试题系列：Redis夺命12问，你能扛到第几问？
Python编程：matplotlib绘制散点图
【AIX 命令学习】激活/停用卷组！
Android 获取设备SN号
美化ubuntu18.04，并安装搜狗输入法
两种使用JavaScript触发ABAP事件的技术手段
Ubuntu VMwork Station虚拟机清理拖拽产生的额外空间
redis 简单整理——redis 的哈希基本结构和命令[三]
PowerDesigner palette 工具栏不见了,怎么找回
遗传算法（GA）优化后RBF神经网络优化分析（Matlab代码实现）
[RK3399][Android7.1] 学习笔记 DRM驱动程序开发(介绍)
一位测试小伙伴面试笔试题的救场 - 这是一篇枪手角度的答题文(最后小伙伴吹大了，痛失offer)
10分钟完成一个最最简单的BLE蓝牙接收数据的DEMO
[翻译] PTEHorizontalTableView
导入数据时遇见ORA-00054

相关主题

Python 语音识别
语音识别
物体识别
人脸微表情识别
66课类型识别
1020.数字识别
虹膜识别

zl程序教程