核心功能
多格式文档处理
Umi-OCR v2.1.5 支持 JPG/PNG/BMP/TIFF等10+图片格式 识别,可批量处理 数百张图片 并导出为 TXT/JSONL/CSV/MD 等格式。新增 PDF文档识别 功能,支持扫描件OCR和双层可搜索PDF生成,大幅提升办公效率。
![图片[1]-Umi-OCR v2.1.5单文件:免费离线OCR软件,支持批量识别、PDF转换与二维码生成 - 搜源站-搜源站](https://www.souyuanzhan.com/wp-content/uploads/2025/05/e253cc640020250503205050-1024x565.webp)
![图片[2]-Umi-OCR v2.1.5单文件:免费离线OCR软件,支持批量识别、PDF转换与二维码生成 - 搜源站-搜源站](https://www.souyuanzhan.com/wp-content/uploads/2025/05/9800185fae20250503205124-1024x565.webp)
智能排版解析
采用 多栏换行算法 自动识别图文排版,保留原始文档逻辑结构。支持 竖排文字识别(需引擎支持),完美适配中日韩文档场景。新增 单栏保留缩进模式,专为代码截图设计。
高级辅助功能
- 忽略区域标记:精准屏蔽水印/页眉页脚干扰(批量OCR专属)
- 二维码全能助手:支持19种编码协议识别与生成,纠错等级自定义
- 跨平台兼容:Windows 7+/Linux x64双平台原生支持,无需虚拟机
使用教程
快速上手流程
- 启动软件后自动检测系统语言(支持简中/繁中/英文)
- 截图OCR:按
Ctrl+Shift+A
唤起截图,识别结果实时显示 - 批量处理:拖拽文件夹至工作区,设置输出路径后开始任务
- 高级功能:通过侧边栏切换至「文档识别」或「二维码」标签
进阶技巧
- 性能优化:在「全局设置」中开启「硬件加速渲染」
- 任务中断:按
Esc
键终止当前操作 - 历史回溯:所有任务记录自动保存,支持重新编辑输出参数
更新内容
新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。指定级别以上(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。
新增:大部分标签页能手动切换左右/上下双栏模式。 (#789)
新增:Esc键隐藏主窗口。 (#652)
新增:调整二维码生成相关参数后,自动刷新二维码生成。 (#690)
新增:命令行指令 –reload ,用于重新加载配置文件。 👉 文档
修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。 (#785)
修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。
修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。
修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。
修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。 (#778)
修复:Linux版本截图后,主窗口的位置与操作前不一致。
优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。 (#710)
Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
新增UI语言:俄语 Русский ,译者:Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米尔语 தமிழ் ,译者:தமிழ்நேரம்。
暂无评论内容