Newlearnerの自留地

#macOS #Github情报 #OCR

alfred-ocr：macOS 上的多接口 Alfred OCR / 翻译插件

Github | Releases

👉 Features：

- 支持离线 OCR（CNOCR）
- 支持通用 OCR （百度，腾讯优图，Google）
- 支持二维码识别（百度）
- 支持文本翻译（彩云小译）
- 支持多文件批量识别（百度）

👉 门槛：

- macOS Alfred 3 及以上版本并激活 Powerpack
- 安装 Python 3 及相应的依赖模块并填写相关路径
- 申请并将对应接口的配置填入环境变量

总的来说，我们需要配合 Alfred 使用，并提前配置好环境、申请好接口。截取区域自动 OCR 这个功能还是蛮实用的，至于翻译，我认为 Bob 会是一个更好的选择。感兴趣的朋友不妨试试

频道：@NewlearnerChannel

4.5K views初学者 | newlearner.site, edited 11:41

Newlearnerの自留地

#Github情报 #OCR

OCRmyPDF·给你的PDF文档添加文字层

Github | WiKi

使用 OCRmyPDF 将 OCR 文本层添加到扫描的PDF文件中，从而可以对其进行搜索或复制粘贴。

✨ 特点
- 使用强大的开源 Tesseract OCR 引擎识别，支持100多种语言
- 调用全部可用CPU资源进行OCR（耗电警告⚠️
- 从常规PDF生成可搜索的PDF文件
- 优化PDF尺寸，生成比输入文件小的文件
- 在执行OCR之前对图像进行歪斜校正和/或清洁

🔍 部署
- 支持多种操作系统 Linux, Win, macOS …
- 支持 brew install ocrmypdf 但需要自己安装语言库
- macOS 一键安装脚本（努力更新中
- 可配合 Alfred / Launchabr 制作成 Workflow 使用

👀 没有文字层的PDF文献/文档真的难受，OCRmyPDF的扫描精准度虽然说不是特别高，但有了文字层，我们就可以方便的在文档里做标注了～

频道：@NewlearnerChannel

6.2K views賈咕ㄍㄨ | 學ㄒㄧ注ㄧㄣ, edited 08:00

Newlearnerの自留地

#Tools #OCR

📩 接订阅者来稿，他向我们推荐了自己的 OCR 微信小程序「Catcher」

Catcher：一款精美的 OCR 微信小程序

👉 Features：

- 黑白主配色，简洁美观无广告，动画流畅
- 集 OCR 识别（文字、链接）、语音朗读、翻译（中英）为一体
- 支持直接拍摄照片或在相册选取照片识别
- 可以手动选择需要的部分（默认识别全文）
- 「成句」功能，除去换行符，将识别文本拼接成完整的内容

OCR，即对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。在和文字图片打交道的过程中，不可避免地会产生对 OCR 的需求。之前频道介绍过了一些桌面端的方案，而 Catcher 则是移动端可以选择来轻度使用的方案

📘 关联阅读：

1️⃣ OCRmyPDF：给你的 PDF 文档添加文字层
2️⃣ alfred-ocr：macOS 上的多接口 Alfred OCR / 翻译插件

频道：@NewlearnerChannel

8.5K views初学者 | newlearner.site, edited 04:00

Newlearnerの自留地

#OCR #Tools

Newlearner 的 OCR 使用分享（在线篇）

通常在图片、PDF文档中提取文字，我们都会使用 OCR(Optical Character Recognition) 技术，今天就和大家分享一下几款比较优秀的 OCR 工具

☁️ Online OCR ☁️

在线 OCR 大多是调用云 OCR 引擎进行处理，对得到的结果进行优化后再输出，所以精确度、还原度会更高。因为大多数 OCR 接口都需要付费，所以有一定的使用成本。

🔍 iText

- 使用 Google & 百度 & 腾讯 OCR 接口，识别精准度高
- 独创算法，优化识别结果
- 支持识别后翻译
- 每月免费体验20次，Pro 版支持月/年付订阅

🔍 天若OCR

- 一款 Windows 平台上的 OCR 工具
- 支持表格识别、竖排识别、LaTex 公式识别、翻译功能
- 支持自定义文本接口
- 提供免费版与付费版，付费版采取买断制

🔍 Bob

- 本质是一款翻译工具，但其附带的 OCR 功能可以满足日常使用
- 支持自定义文本接口，默认使用百度智能云 OCR 接口
- 半开源，免费
- Bob 的作者十分贴心，在使用文档中给出了各大 OCR 接口（百度、腾讯、搜狗、有道）的申请方式：教程地址

频道：@NewlearnerChannel

7.4K views賈思敏｜重學注音中ㄟ, 07:00

Newlearnerの自留地

#OCR #Tools

Newlearner 的 OCR 使用分享（离线篇）

🔌 Offline OCR 🔌

离线的 OCR 工具主要依赖离线库，处理精度上可能比不上在线接口，但优点是可以进行大批量的 OCR 工作，且处理速度较快。

🔍 OwlOCR

- 支持对 PDF, PNG, JPEG, GIF 文件进行 OCR
- 支持在 iOS 设备上拍照，OwlOCR 上立即进行 OCR 处理
- 离线 OCR 多语言支持，包括简体中文和繁体中文，但
- 免费版保留了大部分功能，付费版可以提高 OCR 处理速度

🔍 TextSniper

- 小巧轻量，使用方便
- 支持 OCR 结果叠加至剪切板
- 离线多语言支持
- 买断制 app，包含在 Setapp 订阅中

👀 以上提到的几款 OCR 工具都是在 Win/Mac 端使用的，至于移动端我比较推荐的是「白描」。
我对 OCR 识别精度要求不高，因此使用的是 Bob 的免费接口；OCRmyPDF则是我扫描大型 PDF 文档时采取的方案。

🎗「天若 OCR」与「白描」即将迎来优惠促销活动，有需要的朋友们可以考虑入手。

📘 关联阅读：

1⃣️ OCRmyPDF·给你的PDF文档添加文字层
2⃣️ alfred-ocr：macOS 上的多接口 Alfred OCR / 翻译插件

频道：@NewlearnerChannel

7.5K views賈思敏｜重學注音中ㄟ, 10:00

Newlearnerの自留地

#Apps #macOS #OCR

🔍 LensOCR · 超多语言支持的离线 OCR 工具

官网 | App Store

💡 特点

- 支持超过 100 种语言的 OCR
- 离线 OCR，结果直接复制到剪切板
- 支持使用手机相机扫描文档或图片进行OCR
- 通过拖放来识别图像中不同部分的文字，并将它们合并
- 支持识别专业术语（如医学），可通过自定义词库进行识别校正

🐛 缺点

- OCR 不同语言时需要手动切换
- 不支持中英混合OCR

💻 系统要求

- macOS Catalina：只支持英文OCR
- macOS Bis Sur: 支持中、英、法、德、意、西、葡
- 全语言 + 全系统支持需要购买 LensOCR Pro

💰 收费方案

- 订阅：0.99 USD/月
- 终身买断：9.99 USD
- 目前促销中，终身买断半价：4.99 USD
- 促销截止日期：2021/04/09

👀 市面上常见的 OCR App 大多支持中英，但对小语种的支持不是太友好，LensOCR 支持 100+ 种语言（包含日语、韩语）令人眼前一亮，本地 OCR 的同时能保证不错的准确率；支持自定义词库校正这功能很适合对专业人士使用

假如你对小语种 OCR 有需求，我推荐你入手目前的 4.99 USD 买断 Pro 会员

📘 关联阅读：Newlearner 的 OCR 使用分享（离线篇）

频道：@NewlearnerChannel

6.5K views賈思敏, edited 07:00

Newlearnerの自留地

#OCR #macOS #App #GitHub情报

🔍 macOCR · 命令行 OCR 工具

👉 GitHub

💡 特点

- 命令行工具，可以利用脚本进行功能拓展
- OCR 结果直接复制到剪切板
- 同时支持 Intel Mac 和 Apple Silicon Mac
- 轻量小巧，可以离线使用

🐛 不足

- 只能在 macOS 10.15+ 的设备设备上运行
- 目前仅支持英语 OCR，不支持简/繁中文
- OCR 结果优化一般，不支持换行

🚗 启动器脚本支持

- Alfred Workflow
- LaunchBar Action
- Raycast Script

👀 macOCR 把 OCR 做到了命令行工具里让我有一种这是原生 OCR 工具的错觉。

它虽然不是一个功能强大的 OCR 工具，但拓展性和可玩性很高，例如：macOCR + pbpaste 两个命令配合就能拿到 OCR 结果，然后可以进行下一步拓展如：翻译、搜索。

📘 关联阅读

1⃣️ alfred-ocr：macOS 上的多接口 Alfred OCR / 翻译插件
2⃣️ Newlearner 的 OCR 使用分享（离线篇）

频道：@NewlearnerChannel

6.4K views賈思敏, edited 07:00

Newlearnerの自留地

#macOS #OCR #Develop

🧊 Unfreeze - 代码 OCR 工具

官网

🤔 很多时候我们都会遇到一些开发教程网站为了排版方便或限制用户，只提供代码截图，我们把不得不重新手敲一遍代码，但这有敲错的概率；使用传统的 OCR 工具，可能因为优化不到位，造成缩进、换行混乱，代码根本没法看

Unfreeze 可以很好的的将代码截图转换为格式化代码

💡 特点

- 保留原代码格式和缩进
- 支持在应用内编辑识别结果
- 支持离线使用，处理速度快

🐛 不足

- 对于下划线、引号等小字符识别准确率不高
- UI 设计很一般，编辑窗口不能缩放，难以应付大量代码识别
- 识别后的代码缺少高亮

⚠️ 系统要求

- 需要 macOS Big Sur 11.0 以上的版本

👀 代码 OCR 的需求是有的，但为此专门优化的 OCR 工具并不常见。Unfreeze 的开发者迈出了走向深坑的第一步，但不清楚他是否会持续更新

🌟 期待着更好的同类产品的出现！

频道：@NewlearnerChannel

7.0K views賈思敏, 04:00

Newlearnerの自留地

#macOS #OCR #bob #translate

🔍 翻译工具 Bob 更新：独立 OCR 功能

GitHub｜Docs｜下载

Bob 是我最常用的翻译工具，它提供多种的翻译入口，OCR 截图翻译是其中一个。奈何 Bob 的 OCR 功能太方便，于是作者给 Bob 添加了独立的 OCR 功能

💡 特点

- 离线独立 OCR
- 支持截图识别，图片识别，二维码解析
- 支持多图片 OCR 后文本重组
- 识别结果自动复制至剪切板
- 智能分段优化识别效果，用户可以选择使用服务商的 OCR 或 Bob OCR

📝 提醒

- Bob 的独立 OCR 需要 macOS11 以上的操作系统才可以使用
- Homebrew 安装的 Bob 目前不是最新版，支持OCR的版本需要手动安装

🐦 体验

我个人也是非常依赖通过 Bob 的 OCR 获取待翻译内容，甚至是借用 Bob 来处理一些轻量 OCR 工作，Bob 已经成为我的日常高频使用工具

Bob OCR 实际体验效果和收费 OCR 工具旗鼓相当，离线识别、智能分段和文版再编辑功能都非常赞，建议大家去尝试

📘关联阅读: Newlearner 的 OCR 使用分享（离线篇）

频道：@NewlearnerChannel

7.6K views賈思敏 | Jasmine @un.Block, edited 05:01

Newlearnerの自留地

#macOS #OCR

🔍 Searchable · OCR 屏幕搜索工具

某些用户在日常工作中经常要搜索屏幕的某个区域，但不是所有的软件都提供内建搜索功能，有的软件虽然有搜索功能但并不好用，Searchable 通过 OCR 的方式实现了对屏幕任意区域的内容搜索

主页｜App Store

💡 特点

- 简单易用，无任何上手难度
- 支持复制搜索到的 OCR 内容
- 可以自由调整屏幕 OCR 的范围大小
- 支持将 Searchable 置于屏幕顶层

💰 收费

- 一次性买断，价格为 $2.99

🐦 使用体验

Searchable 通过 OCR 来解决屏幕内容搜索的思路很新奇，工具也非常简洁，基本用法就是确定范围，输入搜索内容，然后就会匹配到搜索结果对应的行

但是，Searchable 只支持对目标行进行匹配，无法精确到确切的目标内容，而且工具也只能解决搜索问题，不能进行进一步的拓展

假如你在寻找一款内容搜索工具，Searchable 应该适合你，但假如你在寻找一款好用的 OCR 工具，它不是最好的选择（个人更推荐直接使用 Apple 自带的 OCR 或 Bob）

频道：@NewlearnerChannel

7.9K views賈思敏 | 0xJasmine, 07:01

Newlearnerの自留地

#GitHub情报 #OCR #Tools

📃 TTime：功能强大的多平台翻译与OCR工具

Web | Github

👉 Features：

- 多种翻译途径
- 截图 OCR
- 开源、免费和多平台支持
- 通过API使用更多翻译源

TTime 是一款开源的翻译和OCR工具，它的灵感来源于macOS平台上的知名软件Bob。在此之前，Bob的用户群体只在macOS平台上，其在Windows或Linux平台上并没有很好的替代品。TTime的出现改变了这一局面。

在功能上，TTime不仅包含了Bob的全部功能，如输入翻译、截图翻译、划词翻译、截图OCR以及静默截图OCR，还在这些基础上做出了一些改进。特别是在截图OCR方面，TTime可以在你截图区域进行文字识别，而且识别的内容可以自动写入剪切板，无需打开OCR窗口，这个功能Bob暂时未提供。

虽然基于Electron开发，但TTime在速度和响应上也能让我比较满意，总体使用很流畅。Windows 上有一款老牌软件名为天若OCR，我相信TTime已经可以替代了。TTime不仅提供了更多的功能，而且在使用体验上更胜一筹。希望未来TTime能提供更多的功能更新。

频道：@NewlearnerChannel

8.0K views𝐏𝐫𝐢𝐧𝐜𝐞𝐭𝐨𝐧, edited 07:01

Newlearnerの自留地

#OCR #Tools #Windows #Linux #macOS #APP

🔍 eSearch：开源、强大的跨平台截图 / OCR / 翻译工具

🔗：GitHub | Web | Releases

👉 Features

- 跨平台、多语言支持
- 丰富的截屏选项，包含滚动截屏、拼接、框选裁切、自由画笔、马赛克等
- 支持截屏美化，可为截屏设置背景、圆角、阴影等
- 提供录屏选项，可自定义大小
- 支持离线 OCR、以图搜图、翻译等多种功能

💻 macOS 这几年更新之后，原生系统下截屏和 OCR 体验都好了不少，更有 CleanShot X 等好用的第三方软件。而 eSearch 把这些好用的功能，带到了全平台

💡 有了 eSearch，你可以便捷地在 Windows 和 Linux 系统中进行截图、录屏、OCR、翻译等操作。经过了几年的迭代，许多功能已经较为成熟，给我一种相见恨晚的感觉

👀 最后，eSearch 不出意外地采用了 Electron 作为自己的跨平台方案，看在它免费又好用的份上，macOS 用户你们忍一下 🐶

📘 关联阅读：

1️⃣ Newlearner 的 OCR 使用分享
2️⃣ pager：帮你重新发现截图的价值
3️⃣ TTime：功能强大的多平台翻译与OCR工具
4️⃣ Setapp 应用上手玩之 CleanShot X
5️⃣ 图几 —— 还需打磨的中国版“Cleanshot X”

频道：@NewlearnerChannel

5.8K views 初学者 | Newlearner365, 07:03

About

Blog

Apps

Platform