Tesseract .Net SDK C# OCR 2022.1
Tesseract .Net SDK C# OCR 库 #将扫描的 PDF 转换为可搜索的文档 #快速准确的基于神经网络的引擎 #纠正低质量扫描 # 120 多种语言 # .Net 2.0+, .Net 5, 标准, 核心
Tesseract OCR - industry-fastest .Net OCR library
4 行代码,仅此而已
var api = OcrApi.Create();
api.Init(Languages.English);
using (var renderer = OcrPdfRenderer.Create("searchable.pdf"))
api.ProcessPages(@"scanned.pdf", renderer);
它只是一个魔术!
得益于简单的 API,您只需几行代码即可将扫描的 PDF 转换为可搜索的文档。
顺便说一句,不仅是PDF。添加到您的应用程序 JPEG、多页 TIFF 或 PNG 转换为可搜索的 PDF 现在只需几分钟,而不是几小时或几天。
120 多种语言的多种图像格式
Tesseract.NET SDK 可准确识别超过 120 种语言的文本,支持多语言文本,并且可以训练使用以前未知的语言。作为标准支持的语言包括英语、法语、意大利语、德语、西班牙语、阿拉伯语、中文、希伯来语、日语、俄语、泰语等。
纠正低质量扫描
例如,去歪斜输入过滤器会自动旋转图像,使其以正确的方式向上和正交。如果页面太倾斜,Tesseract 的线分割质量会显着降低,这会严重影响 OCR 的质量。
Patagames OCR SDK 中内置的用于增强 OCR 性能的输入过滤器包括:二值化、对比度和对比度归一化、去偏斜、增强分辨率、腐蚀和膨胀、膨胀和收缩、反转、删除边框、旋转、ToGray 和白色背景。
为您的 .Net 应用程序配备 OCR 功能的最佳方式
虽然 Tesseract 无疑是迄今为止最好的 OCR 库,但 Tesseract.NET SDK 是为您的应用程序配备文本识别功能的最佳方式之一。
Tesseract.Net SDK 结合易于部署、出色的识别准确性、闪电般快速的 OCR 和多种输出选项(包括 PDF、HOCR、UNLV 和纯文本),提供灵活简单的 API 以及许多高级和低级文本识别程序。
多亏了简单的 API,您可以用几行代码将给定的图像转换为可搜索的文本。如果您需要更详细地了解文本的组成部分,Tesseract.NET SDK API 提供了许多类来检索单个字母、单词、段落甚至字体参数。
您现在可以免费试用 Tesseract.NET SDK,体验 .Net 应用程序有史以来最快、最完美的光学识别。
享受支持 OCR 的 .Net 应用程序的强大开发!
相关文章
- .NET 开源Protobuf-net从入门到精通
- .NET开源Protobuf-net组件修炼手册
- C#.NET常见问题(FAQ)-控制台程序如何输出Messagebox
- C#压缩字符串
- Asp.net(C#) windows 服务{用于实现计划任务,事件监控等}
- C#设计模式——抽象工厂模式(Abstract Factory Pattern)
- C#进阶系列——WebApi 身份认证解决方案:Basic基础认证
- C# 视频监控系列(8):服务器端——预览和可被客户端连接
- Atitit 项目语言的选择 java c#.net php??
- Atitit.java c#.net php项目中的view复用(jsp,aspx,php的复用)
- Atitit.获取approot api 应用根路径 java c#.net php asp
- C# 将字符串中的多个连续空格变成一个
- 改善C#程序的157个建议——建议84学习笔记:使用PLINQ
- (五)c#Winform自定义控件-复选框-HZHControls
- C#静态构造函数
- C# 排序列表(SortedList)