VisionKit教程之 01 识别图像中的文字
2023-09-11 14:18:47 时间
识别图像中的文字
使用Vision框架向您的应用程序添加文本识别功能。
概述
Vision的许多强大功能之一是它能够检测和识别图像中的多语言文本。您可以在自己的应用程序中使用此功能来处理实时和离线用例。在所有情况下,Vision的所有处理都在用户的设备上进行,以提高性能和用户隐私。
Vision的文本识别功能使用以下路径之一进行操作:
-快速地
快速路径使用框架的字符检测功能来查找单个字符,然后使用小型机器学习模型来识别单个字符和单词。此方法类似于传统的光学字符识别(OCR)。
- 准确的
准确的路径使用神经网络根据字符串和线条查找文本,然后执行进一步的分析以查找单个单词和句子。这种方法更符合人类阅读文本的方式。
使用任何一条路径,您都可以选择基于自然语言处理(NLP)应用语言校正阶段,以最大程度地减少误读的可能性。
使用Vision的文本识别功能类似于执行其他Vision操作,在这些操作中,您对图像执行计算机视觉请求并检索得到的观察结果。如果您是Vision框架的新手,请参阅检测静止图像中的对象。
执行文本识别请求
Vision通过一种基于图像的请求类型来提供其文本识别功能,该图像类型用于查找和提取图像中的文本。下面的示例演示如何使用来识别指定CGImage中的文本。VNRecognizeTextRequestVNImageRequestHandlerVNRecogn
相关文章
- 椭圆轮廓识别
- Google Earth Engine ——MYD14A1/A2 V6数据集提供了从MODIS 4米和11米辐射值得出的1公里分辨率的每日火灾掩码合成,火灾识别数据集
- 【MSER+HOG+GA+SVM】基于MSER+HOG+GA+SVM的多个交通标志提取和识别算法
- 【农田杂草识别】基于sift特征提取的农田杂草识别
- 渗透测试-Burp识别验证码暴破密码
- Nessus漏洞扫描教程之使用Nmap工具扫描识别指纹
- 【HMS Core】使用机器学习服务和搜索服务识别植物
- 《操作系统真象还原》——0.23 操作系统是如何识别文件系统的
- 人工智能破译人类思维:深度神经网络可识别人的想象
- Swift基础--手势识别(双击、捏、旋转、拖动、划动、长按)
- 在Android上使用ZXing识别条形码/二维码
- 所在单位近日购入Dell poweredge T640型号服务器,安装Ubuntu18.04.5 server操作系统,服务器万兆网卡,网线连接到千兆交换机上,不能识别网卡——解决方案
- 水果数据集(Fruit-Dataset )+水果分类识别训练代码(支持googlenet, resnet, inception_v3, mobilenet_v2)
- TensorFlow高阶 API: keras教程-使用tf.keras搭建mnist手写数字识别网络
- 微软开发的语音识别技术超越IBM沃森 出错率仅6.3%
- NEC摘得NIST视频面部识别性能测试桂冠
- 深度学习下的验证码识别教程