Aspose.OCR for Java Crack by Xacker
Aspose.OCR for Java 允许您从图像、屏幕截图、图像的特定区域中提取文本,并在任何支持 Java 的平台上从扫描文件创建可搜索的 PDF。凭借其强大且易于使用的 API,即使是复杂的 OCR 任务也只需不到 10 行代码。您无需使用公式和机器学习 - 该库将处理所有技术细节,并以基于拉丁文和西里尔文字的26种语言以及中文生成可靠的结果. OCR API 处理扫描图像、智能手机照片、屏幕截图、图像区域和扫描 PDF,并以最流行的文档格式返回结果。通过跨多个 CPU 内核分配计算并将资源密集型任务卸载到GPU ,可以进一步提高识别速度、准确性和性能。
Aspose.OCR for Java 的特性和功能
识别扫描图像和 PDF 中的格式化文本
支持您可以从扫描仪或照相机获得的所有文件格式
读取拉丁文和西里尔文字
识别6000多个汉字
检测并识别所有流行的字体
小心保留字体样式和格式
仅处理整个图像或选定区域
支持旋转、倾斜和嘈杂的图像
批量识别文件夹或档案中的所有图像
识别作为网络链接提供的图像
查找并自动更正拼写错误的单词
与其他 Aspose 产品 100% 兼容
便于使用
图像识别需要几行代码。字面上地。真的就这么简单——试试你自己:
* 上传文件或使用服务即表示您同意我们的使用条款和隐私政策。
实时代码示例 - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
try {
// Recognize image
String result = api.RecognizePage("<file name>");
// Display the recognition result
System.out.println(result);
} catch (IOException e) {
// Error handling
e.printStackTrace();
}
26种识别语言
OCR API 支持多种语言和所有流行的书写脚本,包括混合语言的文本。内置拼写检查器自动替换拼写错误的单词,免去您手动更正识别结果的麻烦。
- 扩展拉丁字母表:克罗地亚语、捷克语、丹麦语、荷兰语、英语、爱沙尼亚语、芬兰语、法语、德语、意大利语、拉脱维亚语、立陶宛语、挪威语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、西班牙语、瑞典语。
- 西里尔字母:白俄罗斯语、保加利亚语、哈萨克语、俄语、塞尔维亚语、乌克兰语。
- 中文:6000多个字。
您可以指定语言以提高识别性能和可靠性,或者让 API 自动检测语言。
保留格式
OCR API 以常规、粗体和斜体样式读取所有流行字体,例如 Arial、Times New Roman、Courier New、Tahoma、Calibri 等,并仔细保留 OCR 结果中的格式。您还可以将识别结果拆分为多行并检测页面中的文本区域。
识别照片
扫描仪在最终用户工作站上并不总是可用,这可能会成为 OCR 应用程序的障碍。我们的 OCR API 提供了许多预处理过滤器,可以处理扭曲、旋转、倾斜和嘈杂的图像。结合对所有图像格式的支持,它甚至可以可靠地识别智能手机照片。大部分预处理和图像校正都是自动完成的,但您始终可以在困难的情况下进行干预。
应用图像校正 - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
性能优化
光学字符识别需要大量的处理资源,这可能成为网络服务和入门级设备的问题。API 提供了非常灵活的方式来平衡识别速度、资源需求和准确性:
- 在彻底识别和快速识别之间进行选择。
- 指定为识别分配的线程数,或允许库自动扩展到 CPU 核心数。
- 通过将计算卸载到 GPU 来释放 CPU。
快速识别 - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Recognize image in the fastest mode
String result = api.RecognizePageFast("sample.jpg");
批量处理
OCR API 提供了多种批处理方法,让您可以在一次调用中识别多张图像,从而使您不必一次识别每张图像:
- 识别多页 PDF 和 TIFF 文件。
- 识别档案中的所有文件。
- 识别文件夹中的所有文件。
相关文章
- Java实现 蓝桥杯 算法训练 第五次作业:字符串排序
- java实现找素数
- Java实现 蓝桥杯VIP 算法训练 数的统计
- 【JAVA】java中的length和length()
- java 11 标准Java异步HTTP客户端
- 【JAVA】foreach语句 -- for(int I : nums){}
- [Java Spring] Testing a view controller
- Java超类-java.lang.object
- paip.日期时间操作以及时间戳uapi php java python 总结
- Spire.Office for Java 7.10.FIX[7.9.9]-全新版
- How to improve Java's I/O performance( 提升 java i/o 性能)
- 【异常】Error querying database. Cause: java.sql.SQLException: No value specified for parameter 1
- 【java】Java ArrayList
- Cipher 使用 RSA非对称加密算法 - 公钥加密后,只有私钥才可以解密,私钥加密后,只有公钥才可以解密 - java具体使用 非对称加密算法 - 总结心得
- Java异常分类
- JAVA程序猿面试题汇总
- Caused by: java.net.ConnectException: Call From master/192.168.199.130 to master:9000 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.
- IronPDF for Java 2022.11.1 Crack
- Aspose.PDF for Java Crack by Xacker
- 首次使用Oracle SQL Developer 提示: enter the full pathname for java.exe
- 【java】Java IO体系总览