Newlearnerの自留地
55.7K subscribers
11.4K photos
30 videos
62 files
8.64K links
🆕 不定期推送 IT 相关资讯,欢迎关注!

👥 博客群&投稿群&交流群: @NewlearnerGroup

📩 投稿请私信 @newlearner_pm_bot

🔍 频道内容关键词索引 Bot: @newlearner_search_bot

* 未经授权或标注来源,不得转载本频道内容
Download Telegram
#macOS #Github情报 #OCR

alfred-ocr:macOS 上的多接口 Alfred OCR / 翻译插件

Github | Releases

👉 Features:

- 支持离线 OCR(CNOCR)
- 支持通用 OCR (百度,腾讯优图,Google)
- 支持二维码识别 (百度)
- 支持文本翻译 (彩云小译)
- 支持多文件批量识别 (百度)

👉 门槛:

- macOS Alfred 3 及以上版本并激活 Powerpack
- 安装 Python 3 及相应的依赖模块并填写相关路径
- 申请并将对应接口的配置填入环境变量

总的来说,我们需要配合 Alfred 使用,并提前配置好环境、申请好接口。截取区域自动 OCR 这个功能还是蛮实用的,至于翻译,我认为 Bob 会是一个更好的选择。感兴趣的朋友不妨试试

频道:@NewlearnerChannel
#Github情报 #OCR

OCRmyPDF·给你的PDF文档添加文字层

Github | WiKi

使用 OCRmyPDF 将 OCR 文本层添加到扫描的PDF文件中,从而可以对其进行搜索或复制粘贴。

特点
- 使用强大的开源 Tesseract OCR引擎识别,支持100多种语言
- 调用全部可用CPU资源进行OCR(耗电警告⚠️
- 从常规PDF生成可搜索的PDF文件
- 优化PDF尺寸,生成比输入文件小的文件
- 在执行OCR之前对图像进行歪斜校正和/或清洁

🔍 部署
- 支持多种操作系统 Linux, Win, macOS …
- 支持 brew install ocrmypdf 但需要自己安装语言库
- macOS 一键安装脚本 (努力更新中
- 可配合 Alfred / Launchabr 制作成 Workflow 使用

👀 没有文字层的PDF文献/文档真的难受,OCRmyPDF的扫描精准度虽然说不是特别高, 但有了文字层,我们就可以方便的在文档里做标注了~

频道:@NewlearnerChannel
#Tools #OCR

📩 接订阅者来稿,他向我们推荐了自己的 OCR 微信小程序「Catcher

Catcher:一款精美的 OCR 微信小程序

👉 Features:

- 黑白主配色,简洁美观无广告,动画流畅
- 集 OCR 识别(文字、链接)、语音朗读、翻译(中英)为一体
- 支持直接拍摄照片或在相册选取照片识别
- 可以手动选择需要的部分(默认识别全文)
- 「成句」功能,除去换行符,将识别文本拼接成完整的内容

OCR,即对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。在和文字图片打交道的过程中,不可避免地会产生对 OCR 的需求。之前频道介绍过了一些桌面端的方案,而 Catcher 则是移动端可以选择来轻度使用的方案

📘 关联阅读:

1️⃣ OCRmyPDF:给你的 PDF 文档添加文字层
2️⃣ alfred-ocr:macOS 上的多接口 Alfred OCR / 翻译插件

频道:@NewlearnerChannel
#OCR #Tools

Newlearner 的 OCR 使用分享(在线篇)

通常在图片、PDF文档中提取文字,我们都会使用 OCR(Optical Character Recognition) 技术,今天就和大家分享一下几款比较优秀的 OCR 工具

☁️ Online OCR ☁️

在线 OCR 大多是调用云 OCR 引擎进行处理,对得到的结果进行优化后再输出,所以精确度、还原度会更高。因为大多数 OCR 接口都需要付费,所以有一定的使用成本。

🔍 iText

- 使用 Google & 百度 & 腾讯 OCR 接口,识别精准度高
- 独创算法,优化识别结果
- 支持识别后翻译
- 每月免费体验20次,Pro 版支持月/年付订阅

🔍 天若OCR

- 一款 Windows 平台上的 OCR 工具
- 支持表格识别、竖排识别、LaTex 公式识别、翻译功能
- 支持自定义文本接口
- 提供免费版与付费版,付费版采取买断制

🔍 Bob

- 本质是一款翻译工具,但其附带的 OCR 功能可以满足日常使用
- 支持自定义文本接口,默认使用百度智能云 OCR 接口
- 半开源,免费
- Bob 的作者十分贴心,在使用文档中给出了各大 OCR 接口(百度、腾讯、搜狗、有道)的申请方式:教程地址

频道:@NewlearnerChannel
#OCR #Tools

Newlearner 的 OCR 使用分享(离线篇)

🔌 Offline OCR 🔌

离线的 OCR 工具主要依赖离线库,处理精度上可能比不上在线接口,但优点是可以进行大批量的 OCR 工作,且处理速度较快。

🔍 OwlOCR

- 支持对 PDF, PNG, JPEG, GIF 文件进行 OCR
- 支持在 iOS 设备上拍照,OwlOCR 上立即进行 OCR 处理
- 离线 OCR 多语言支持,包括简体中文和繁体中文,但
- 免费版保留了大部分功能,付费版可以提高 OCR 处理速度

🔍 TextSniper

- 小巧轻量,使用方便
- 支持 OCR 结果叠加至剪切板
- 离线多语言支持
- 买断制 app,包含在 Setapp 订阅中

👀 以上提到的几款 OCR 工具都是在 Win/Mac 端使用的,至于移动端我比较推荐的是「白描」。
我对 OCR 识别精度要求不高,因此使用的是 Bob 的免费接口;OCRmyPDF则是我扫描大型 PDF 文档时采取的方案。

🎗「天若 OCR」与「白描」 即将迎来优惠促销活动,有需要的朋友们可以考虑入手。

📘 关联阅读:

1⃣️ OCRmyPDF·给你的PDF文档添加文字层
2⃣️ alfred-ocr:macOS 上的多接口 Alfred OCR / 翻译插件

频道:@NewlearnerChannel
#Apps #macOS #OCR

🔍 LensOCR · 超多语言支持的离线 OCR 工具

官网 | App Store

💡 特点

- 支持超过 100 种语言的 OCR
- 离线 OCR,结果直接复制到剪切板
- 支持使用手机相机扫描文档或图片进行OCR
- 通过拖放来识别图像中不同部分的文字,并将它们合并
- 支持识别专业术语(如医学),可通过自定义词库进行识别校正

🐛 缺点

- OCR 不同语言时需要手动切换
- 不支持中英混合OCR

💻 系统要求

- macOS Catalina:只支持英文OCR
- macOS Bis Sur: 支持中、英、法、德、意、西、葡
- 全语言 + 全系统支持需要购买 LensOCR Pro

💰 收费方案

- 订阅:0.99 USD/月
- 终身买断:9.99 USD
- 目前促销中,终身买断半价:4.99 USD
- 促销截止日期:2021/04/09

👀 市面上常见的 OCR App 大多支持中英,但对小语种的支持不是太友好,LensOCR 支持 100+ 种语言(包含日语、韩语)令人眼前一亮,本地 OCR 的同时能保证不错的准确率;支持自定义词库校正这功能很适合对专业人士使用

假如你对小语种 OCR 有需求,我推荐你入手目前的 4.99 USD 买断 Pro 会员

📘 关联阅读:Newlearner 的 OCR 使用分享(离线篇

频道:@NewlearnerChannel
#OCR #macOS #App #GitHub情报

🔍 macOCR · 命令行 OCR 工具

👉 GitHub

💡 特点

- 命令行工具,可以利用脚本进行功能拓展
- OCR 结果直接复制到剪切板
- 同时支持 Intel Mac 和 Apple Silicon Mac
- 轻量小巧,可以离线使用

🐛 不足

- 只能在 macOS 10.15+ 的设备设备上运行
- 目前仅支持英语 OCR, 不支持简/繁中文
- OCR 结果优化一般,不支持换行

🚗 启动器脚本支持

- Alfred Workflow
- LaunchBar Action
- Raycast Script

👀 macOCR 把 OCR 做到了命令行工具里让我有一种这是原生 OCR 工具的错觉。

它虽然不是一个功能强大的 OCR 工具,但拓展性和可玩性很高,例如:macOCR + pbpaste 两个命令配合就能拿到 OCR 结果,然后可以进行下一步拓展如:翻译、搜索。

📘 关联阅读

1⃣️ alfred-ocr:macOS 上的多接口 Alfred OCR / 翻译插件
2⃣️ Newlearner 的 OCR 使用分享(离线篇

频道:@NewlearnerChannel
#macOS #OCR #Develop

🧊 Unfreeze - 代码 OCR 工具

官网

🤔 很多时候我们都会遇到一些开发教程网站为了排版方便或限制用户,只提供代码截图,我们把不得不重新手敲一遍代码,但这有敲错的概率;使用传统的 OCR 工具,可能因为优化不到位,造成缩进、换行混乱,代码根本没法看

Unfreeze 可以很好的的将代码截图转换为格式化代码

💡 特点

- 保留原代码格式和缩进
- 支持在应用内编辑识别结果
- 支持离线使用,处理速度快

🐛 不足

- 对于下划线、引号等小字符识别准确率不高
- UI 设计很一般,编辑窗口不能缩放,难以应付大量代码识别
- 识别后的代码缺少高亮

⚠️ 系统要求

- 需要 macOS Big Sur 11.0 以上的版本

👀 代码 OCR 的需求是有的,但为此专门优化的 OCR 工具并不常见。Unfreeze 的开发者迈出了走向深坑的第一步,但不清楚他是否会持续更新

🌟 期待着更好的同类产品的出现!

频道:@NewlearnerChannel
#macOS #OCR #bob #translate

🔍 翻译工具 Bob 更新:独立 OCR 功能

GitHubDocs下载

Bob 是我最常用的翻译工具,它提供多种的翻译入口,OCR 截图翻译是其中一个。奈何 Bob 的 OCR 功能太方便,于是作者给 Bob 添加了独立的 OCR 功能

💡 特点

- 离线独立 OCR
- 支持截图识别,图片识别,二维码解析
- 支持多图片 OCR 后文本重组
- 识别结果自动复制至剪切板
- 智能分段优化识别效果,用户可以选择使用服务商的 OCR 或 Bob OCR

📝 提醒

- Bob 的独立 OCR 需要 macOS11 以上的操作系统才可以使用
- Homebrew 安装的 Bob 目前不是最新版,支持OCR的版本需要手动安装

🐦 体验

我个人也是非常依赖通过 Bob 的 OCR 获取待翻译内容,甚至是借用 Bob 来处理一些轻量 OCR 工作,Bob 已经成为我的日常高频使用工具

Bob OCR 实际体验效果和收费 OCR 工具旗鼓相当,离线识别、智能分段和文版再编辑功能都非常赞,建议大家去尝试

📘关联阅读: Newlearner 的 OCR 使用分享(离线篇)

频道:@NewlearnerChannel
#macOS #OCR

🔍 Searchable · OCR 屏幕搜索工具

某些用户在日常工作中经常要搜索屏幕的某个区域,但不是所有的软件都提供内建搜索功能,有的软件虽然有搜索功能但并不好用,Searchable 通过 OCR 的方式实现了对屏幕任意区域的内容搜索

主页App Store

💡 特点

- 简单易用,无任何上手难度
- 支持复制搜索到的 OCR 内容
- 可以自由调整屏幕 OCR 的范围大小
- 支持将 Searchable 置于屏幕顶层

💰 收费

- 一次性买断,价格为 $2.99

🐦 使用体验

Searchable 通过 OCR 来解决屏幕内容搜索的思路很新奇,工具也非常简洁,基本用法就是确定范围,输入搜索内容,然后就会匹配到搜索结果对应的行

但是,Searchable 只支持对目标行进行匹配,无法精确到确切的目标内容,而且工具也只能解决搜索问题,不能进行进一步的拓展

假如你在寻找一款内容搜索工具,Searchable 应该适合你,但假如你在寻找一款好用的 OCR 工具,它不是最好的选择(个人更推荐直接使用 Apple 自带的 OCR 或 Bob)

频道:@NewlearnerChannel
#GitHub情报 #OCR #Tools

📃 TTime:功能强大的多平台翻译与OCR工具

Web | Github

👉 Features:

- 多种翻译途径
- 截图 OCR
- 开源、免费和多平台支持
- 通过API使用更多翻译源

TTime 是一款开源的翻译和OCR工具,它的灵感来源于macOS平台上的知名软件Bob。在此之前,Bob的用户群体只在macOS平台上,其在Windows或Linux平台上并没有很好的替代品。TTime的出现改变了这一局面。

在功能上,TTime不仅包含了Bob的全部功能,如输入翻译、截图翻译、划词翻译、截图OCR以及静默截图OCR,还在这些基础上做出了一些改进。特别是在截图OCR方面,TTime可以在你截图区域进行文字识别,而且识别的内容可以自动写入剪切板,无需打开OCR窗口,这个功能Bob暂时未提供。

虽然基于Electron开发,但TTime在速度和响应上也能让我比较满意,总体使用很流畅。Windows 上有一款老牌软件名为天若OCR,我相信TTime已经可以替代了。TTime不仅提供了更多的功能,而且在使用体验上更胜一筹。希望未来TTime能提供更多的功能更新。

频道:@NewlearnerChannel