西西软件园多重安全检测下载网站、值得信赖的软件下载站!
西西首页 电脑软件 安卓软件 电脑游戏 安卓游戏 排行榜 专题合集

Umi-OCR文字识别工具软件

v2.1.2 绿色版
  • Umi-OCR文字识别工具软件v2.1.2 绿色版
  • 软件大小:95.1M
  • 更新时间:2023-11-07 08:54
  • 软件语言:中文
  • 软件厂商:
  • 软件类别:国产软件 / 免费软件 / 图像转换
  • 软件等级:3级
  • 应用平台:WinAll
  • 官方网站:暂无
  • 应用备案:
好评:50%
坏评:50%

软件介绍

Umi-OCR文字识别工具软件是一款免费开源可批量的离线OCR软件,解压即用,离线运行,无需网络。采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。

Umi-OCR文字识别工具软件

软件说明

全新升级:版本重构了绝大部分代码,提供焕然一新的界面和更强大的功能。

免费:本项目所有代码开源,完全免费。

方便:解压即用,离线运行,无需网络。

高效:自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。

灵活:支持定制界面,支持命令行、HTTP接口等多种调用方式。

软件特色

标签页

由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页,并锁定标签栏。

截图OCR

截图OCR:打开这一页后,就可以用快捷键唤起截图,识别图中的文字。

左侧的图片预览栏,可直接用鼠标划选复制。

右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。

也支持在别处复制图片,粘贴到Umi-OCR进行识别。

批量OCR

批量OCR:这一页支持批量导入本地图片并识别。

识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。

支持文本后处理技术,能识别属于同一自然段的文字,并将其合并。还支持代码段、竖排文本等多种处理方案。

没有数量上限,可一次性导入几百张图片进行任务。

支持任务完成后自动关机/待机。

忽略区域:一种特殊功能,适用于排除图片中的不想要的文字。

在批量识别页的右栏设置中可进入忽略区域编辑器。

如上方样例,图片顶部和右下角存在多个水印 / LOGO。如果批量识别这类图片,水印会对识别结果造成干扰。

按住右键,绘制多个矩形框。这些区域内的文字将在任务中被忽略。

请尽量将矩形框画得大一些,完全包裹住水印所有可能出现的位置。

二维码

二维码:这里可以扫码。

支持多种格式的二维码、条形码。

支持一图多码。

可截图/粘贴/拖入本地图片。

全局设置

全局设置:在这里可以调整软件的全局参数。

支持更改界面语言。(翻译校对工作将在第一个正式版发布后进行)

支持切换界面主题。Umi-OCR拥有多个亮/暗主题。

可以调整界面文字大小、文字字体。

切换OCR插件。

辅助功能说明:

多国语言界面:软件界面支持多国语言。目前预览阶段为AI翻译生成,可能词义和排版不好,或者有错漏的情况。正式发布时会进行人工校对。

渲染器:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整全局设置→界面和外观→渲染器。

文本块后处理(段落合并)可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案如下:

单行:合并同一行的文字,适合绝大部分情景。

多行-自然段:智能识别、合并属于同一段落的文字,适合绝大部分情景。

多行-代码段:尽可能还原原始排版的缩进与空格。适合识别代码片段,或需要保留空格的场景。

竖排:适合竖排排版。需要与同样支持竖排识别的模型库配合使用。

简单上手

准备

下载压缩包并解压全部文件即可。

截图识别

点击截图按钮或自定义快捷键,唤起截图识别。

粘贴图片到软件

在任何地方(如文件管理器,网页,微信)复制图片,软件上点击粘贴按钮,自动识别。

批量识别本地图片文件

将图片或文件夹拖进软件,批量转换文字。也可以点击按钮打开浏览窗口导入。

识别结果将保存到本地。可选生成纯文本txt文件、带链接Markdown文件、原始信息jsonl文件等不同格式。可配置任务完成后执行关机/待机。

文本块后处理(排版优化)

OCR识别出的文本是按“块”划分的,通常一行文字分为一块,有时还会将一行误划分为多块,这给阅读带来了不便。文本块后处理就是对文本块进行再加工的过程,合并同一行或同一段落内的文字,按正确的顺序排序。

下图表示不同排版应该选用何种处理方案:

所有方案一览:

横排-优化单行

将误划分为多块的同一行文字合并到一行。

横排-合并多行-左对齐

将多个左对齐的行视为同一段落,合并文字。左侧未对齐或行距过大的行视为下一段落。

横排-合并多行-自然段

将多个左对齐的行视为同一段落,且第一行的开头允许多空出两个全角空格的宽度。

横排-合并多行-模糊匹配

只要垂直投影有重叠,行高一致,距离较近的文本块,视为同一段落。

竖排-从左到右-单行 / 竖排-从右至左-单行

优化竖排识别,合并同一行文字,按从左到右或从右到左的顺序输出每一行。 注意,必须搭配支持竖排识别的模型库(识别语言)一起使用。

可视化预览:

可以在忽略区域编辑器内预览文本块后处理的效果。编辑器中以虚线框标出识别到、经过后处理的文字块。

这里仅仅是借用了编辑器来展示后处理的效果,实际运行任务时 忽略区域机制 早于 后处理机制 执行,不受后处理的影响。

忽略区域功能

忽略区域是本软件特色功能,可用于排除图片中水印的干扰,让识别结果只留下所需的文本。

更新日志

新增:记忆窗口位置。 

新增:批量识图页增加图片预览窗口,单击图片条目打开。 

新增:检查软件是否有权限读写配置文件。

新增:报错弹窗提供一键复制及打开issues的功能。

新增:全局设置页添加左侧目录栏。

新增:插件的多国语言UI机制。

优化:截图预览面板中,文本框的位置更准确。

优化:调整部分UI布置。

修复:扫码模块添加导入异常检查。

修复:补充扫码页的拖入图片功能。 

修复:输出到单独文件txt时,文件名去除原后缀。

修复:一些小Bug。

软件截图

Umi-OCR文字识别工具软件 v2.1.2 绿色版

    其他版本下载

    发表评论

    昵称:
    表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲

    下载帮助下载帮助西西破解版软件均来自互联网, 如有侵犯您的版权, 请与我们联系。

    TOP
    软件下载