zl程序教程

您现在的位置是:首页 >  云平台

当前栏目

VisionKit教程之 01 识别图像中的文字

识别教程 图像 01 文字
2023-09-11 14:18:47 时间

识别图像中的文字

使用Vision框架向您的应用程序添加文本识别功能。

概述

Vision的许多强大功能之一是它能够检测和识别图像中的多语言文本。您可以在自己的应用程序中使用此功能来处理实时和离线用例。在所有情况下,Vision的所有处理都在用户的设备上进行,以提高性能和用户隐私。

Vision的文本识别功能使用以下路径之一进行操作:

-快速地
快速路径使用框架的字符检测功能来查找单个字符,然后使用小型机器学习模型来识别单个字符和单词。此方法类似于传统的光学字符识别(OCR)。

  • 准确的
    准确的路径使用神经网络根据字符串和线条查找文本,然后执行进一步的分析以查找单个单词和句子。这种方法更符合人类阅读文本的方式。

使用任何一条路径,您都可以选择基于自然语言处理(NLP)应用语言校正阶段,以最大程度地减少误读的可能性。

image.png

使用Vision的文本识别功能类似于执行其他Vision操作,在这些操作中,您对图像执行计算机视觉请求并检索得到的观察结果。如果您是Vision框架的新手,请参阅检测静止图像中的对象。

执行文本识别请求

Vision通过一种基于图像的请求类型来提供其文本识别功能,该图像类型用于查找和提取图像中的文本。下面的示例演示如何使用来识别指定CGImage中的文本。VNRecognizeTextRequestVNImageRequestHandlerVNRecogn