Umi-OCR文字识别工具软件是一款免费开源可批量的离线OCR软件,解压即用,离线运行,无需网络。采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。
软件说明
全新升级:版本重构了绝大部分代码,提供焕然一新的界面和更强大的功能。
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
高效:自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
灵活:支持定制界面,支持命令行、HTTP接口等多种调用方式。
软件特色
标签页
由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页,并锁定标签栏。
截图OCR
截图OCR:打开这一页后,就可以用快捷键唤起截图,识别图中的文字。
左侧的图片预览栏,可直接用鼠标划选复制。
右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。
也支持在别处复制图片,粘贴到Umi-OCR进行识别。
批量OCR
批量OCR:这一页支持批量导入本地图片并识别。
识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。
支持文本后处理技术,能识别属于同一自然段的文字,并将其合并。还支持代码段、竖排文本等多种处理方案。
没有数量上限,可一次性导入几百张图片进行任务。
支持任务完成后自动关机/待机。
忽略区域:一种特殊功能,适用于排除图片中的不想要的文字。
在批量识别页的右栏设置中可进入忽略区域编辑器。
如上方样例,图片顶部和右下角存在多个水印 / LOGO。如果批量识别这类图片,水印会对识别结果造成干扰。
按住右键,绘制多个矩形框。这些区域内的文字将在任务中被忽略。
请尽量将矩形框画得大一些,完全包裹住水印所有可能出现的位置。
二维码
二维码:这里可以扫码。
支持多种格式的二维码、条形码。
支持一图多码。
可截图/粘贴/拖入本地图片。
全局设置
全局设置:在这里可以调整软件的全局参数。
支持更改界面语言。(翻译校对工作将在第一个正式版发布后进行)
支持切换界面主题。Umi-OCR拥有多个亮/暗主题。
可以调整界面文字大小、文字字体。
切换OCR插件。
辅助功能说明:
多国语言界面:软件界面支持多国语言。目前预览阶段为AI翻译生成,可能词义和排版不好,或者有错漏的情况。正式发布时会进行人工校对。
渲染器:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整全局设置→界面和外观→渲染器。
文本块后处理(段落合并)可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案如下:
单行:合并同一行的文字,适合绝大部分情景。
多行-自然段:智能识别、合并属于同一段落的文字,适合绝大部分情景。
多行-代码段:尽可能还原原始排版的缩进与空格。适合识别代码片段,或需要保留空格的场景。
竖排:适合竖排排版。需要与同样支持竖排识别的模型库配合使用。
简单上手
准备
下载压缩包并解压全部文件即可。
截图识别
点击截图按钮或自定义快捷键,唤起截图识别。
粘贴图片到软件
在任何地方(如文件管理器,网页,微信)复制图片,软件上点击粘贴按钮,自动识别。
批量识别本地图片文件
将图片或文件夹拖进软件,批量转换文字。也可以点击按钮打开浏览窗口导入。
识别结果将保存到本地。可选生成纯文本txt文件、带链接Markdown文件、原始信息jsonl文件等不同格式。可配置任务完成后执行关机/待机。
文本块后处理(排版优化)
OCR识别出的文本是按“块”划分的,通常一行文字分为一块,有时还会将一行误划分为多块,这给阅读带来了不便。文本块后处理就是对文本块进行再加工的过程,合并同一行或同一段落内的文字,按正确的顺序排序。
下图表示不同排版应该选用何种处理方案:
所有方案一览:
横排-优化单行
将误划分为多块的同一行文字合并到一行。
横排-合并多行-左对齐
将多个左对齐的行视为同一段落,合并文字。左侧未对齐或行距过大的行视为下一段落。
横排-合并多行-自然段
将多个左对齐的行视为同一段落,且第一行的开头允许多空出两个全角空格的宽度。
横排-合并多行-模糊匹配
只要垂直投影有重叠,行高一致,距离较近的文本块,视为同一段落。
竖排-从左到右-单行 / 竖排-从右至左-单行
优化竖排识别,合并同一行文字,按从左到右或从右到左的顺序输出每一行。 注意,必须搭配支持竖排识别的模型库(识别语言)一起使用。
可视化预览:
可以在忽略区域编辑器内预览文本块后处理的效果。编辑器中以虚线框标出识别到、经过后处理的文字块。
这里仅仅是借用了编辑器来展示后处理的效果,实际运行任务时 忽略区域机制 早于 后处理机制 执行,不受后处理的影响。
忽略区域功能
忽略区域是本软件特色功能,可用于排除图片中水印的干扰,让识别结果只留下所需的文本。
更新日志
新增:记忆窗口位置。
新增:批量识图页增加图片预览窗口,单击图片条目打开。
新增:检查软件是否有权限读写配置文件。
新增:报错弹窗提供一键复制及打开issues的功能。
新增:全局设置页添加左侧目录栏。
新增:插件的多国语言UI机制。
优化:截图预览面板中,文本框的位置更准确。
优化:调整部分UI布置。
修复:扫码模块添加导入异常检查。
修复:补充扫码页的拖入图片功能。
修复:输出到单独文件txt时,文件名去除原后缀。
修复:一些小Bug。