您现在的位置是：首页 > 云平台

当前栏目

VisionKit教程之 01 识别图像中的文字

识别教程图像 01 文字

2023-09-11 14:18:47 时间

识别图像中的文字

使用Vision框架向您的应用程序添加文本识别功能。

概述

Vision的许多强大功能之一是它能够检测和识别图像中的多语言文本。您可以在自己的应用程序中使用此功能来处理实时和离线用例。在所有情况下，Vision的所有处理都在用户的设备上进行，以提高性能和用户隐私。

Vision的文本识别功能使用以下路径之一进行操作：

-快速地
快速路径使用框架的字符检测功能来查找单个字符，然后使用小型机器学习模型来识别单个字符和单词。此方法类似于传统的光学字符识别（OCR）。

准确的
准确的路径使用神经网络根据字符串和线条查找文本，然后执行进一步的分析以查找单个单词和句子。这种方法更符合人类阅读文本的方式。

使用任何一条路径，您都可以选择基于自然语言处理（NLP）应用语言校正阶段，以最大程度地减少误读的可能性。

使用Vision的文本识别功能类似于执行其他Vision操作，在这些操作中，您对图像执行计算机视觉请求并检索得到的观察结果。如果您是Vision框架的新手，请参阅检测静止图像中的对象。

执行文本识别请求

Vision通过一种基于图像的请求类型来提供其文本识别功能，该图像类型用于查找和提取图像中的文本。下面的示例演示如何使用来识别指定CGImage中的文本。VNRecognizeTextRequestVNImageRequestHandlerVNRecogn

猜你喜欢

三星不愿意和“夙敌”富士康为伍：已卖掉夏普股权
SPI UART区别是什么
Linux下Oracle的启动登陆命令、单实例启动、多实例启动
nginx 502错 failed (13: Permission denied)
oracle函数 VSIZE(X)
《Haskell并行与并发编程》——第2章，第2.1节惰性求值和弱首范式
C# 窗口事件
【网摘阅读】舒迅：产品经理必读的九步法
杭电 1548 A strange lift（广搜）
《JavaScript入门经典（第6版）》——1.3　JavaScript简介
高效程序猿的45个习惯：敏捷开发修炼之道之主题建议翻译1-10
sqlserver触发器的例子
mysql实现主从复制/主从同步
xml和对象转换

相关主题

数字识别
ie不识别
手势识别
身份证识别
人脸检测与识别
基于matlab的车牌识别

zl程序教程

当前栏目

VisionKit教程之 01 识别图像中的文字

识别图像中的文字

概述

执行文本识别请求

相关文章