Newlearnerの自留地
63.8K subscribers
14.2K photos
44 videos
66 files
10.8K links
🆕 不定期推送 IT 相关资讯,欢迎关注!

👥 博客群&投稿群&交流群: @NewlearnerGroup

📩 投稿请私信 @newlearner_pm_bot

🔍 频道内容关键词索引 Bot: @newlearner_search_bot

* 未经授权或标注来源,不得转载本频道内容
Download Telegram
#macOS #GitHub情报

📋 Deck:新的 macOS 剪贴板管理器

🔗GitHub | Website

⭐️ Features:

• 记录文本、图片、文件、颜色、链接和富文本
• 本地语义搜索、OCR、模板库、文本转换
• 隐私优先,支持敏感信息过滤和 Touch ID / Face ID 解锁
• 支持局域网分享、快捷键操作、CLI Bridge 和 Siri Shortcuts

Deck 是新的一个 macOS 的剪贴板工具,但这次不是那种只会“保存复制历史”的基础款了。除了最基本的历史记录和搜索,它还加入了 OCR、语义搜索、模板、规则自动化、链接清洗、即时计算,甚至还能识别 Figma 剪贴板内容和 IDE 里的文件路径加行号。在 UI 上 Deck 向大名鼎鼎的 Paste 靠近,这种设计私以为截图很好看但是占用空间过大,反而可能降低效率(?)。

Deck 明确强调 local-first,数据默认留在本地,还会对银行卡号、证件号之类的敏感内容做过滤,也能在检测到敏感窗口、录屏或屏幕共享时隐藏面板。一个剪贴板软件愿意认真处理这些问题,我觉得比多加几个花哨功能更重要,毕竟剪贴板本来就是最容易混进隐私数据的地方。

👀 Deck 目前完全免费,只支持 macOS 14 及更新的系统版本;另外虽然是发布在 Github 上的公开仓库,但实际上是 source-available,而不是通常意义上的开源,README 里也明确写了不接受 pull request,代码自由度可能没那么高。但如果你本来就在找一个功能密度高、设计思路现代、同时又把隐私问题放在前面的 macOS 剪贴板工具,Deck 确实是近期很值得看的一个项目。另外,开发者 yuzeguitarist 非常有巧思,他的另外一个项目 Orbit 也非常有意思。

📘 关联阅读:Maccy - 开源、轻量的 macOS 剪切板管理器

频道:@NewlearnerChannel
10👍4
#Web #GitHub情报 #Life

✈️ Aeris:实时 3D 航班飞行可视化网页

🔗GitHub | Demo

👉 Features

- 3D 空域展示,实时航班渲染
- 按高度分层 / 客机种类显示航班
- 良好的动态镜头 / 动画体验
- 提供多个航班数据源

🛩 之前和大家分享了实时展示地铁运行状况的开源项目,最近冲浪又看到了一个用 WebGL / Three.js 制作的在线航班飞行可视化网页。你可以选择一个城市,然后静静看着上方空域的客机飞行情况

💡 网站的动画和地图做得很用心,数据来自开放数据 OpenSky 以及开源社区聚合网络 ADS-B,存在着不全面的问题。当然了,这样的开源项目没有办法和商业化的 Flightradar24 相比,但依然有许多自己捣鼓的乐趣

👀 在了解 Aeris 的过程中,查询到了自建 ADS-B 接收站的相关信息。我们可以做一套「SDR 接收器 + 天线 + 软件主机」的组合,来接收小范围内 1090 MHz 的飞机广播,从而自行确定客机航线和飞行等信息,并将这些数据接入 Aeris,还是很好玩的(在中国大陆等地区可能存在法律风险,请先了解当地法规)

📘 关联阅读:

1️⃣ Air Travel Design Guide:面向机场工作者、设计师和航空旅行爱好者的在线指南
2️⃣ 介绍两个有趣的地铁网页可视化项目
3️⃣ FocusFlight:让专注像航班起飞一样简单沉浸

频道:@NewlearnerChannel
👍6😘4
#GitHub情报 #Blog #Web

📒 GitHub Pages + Hexo 搭建的又一个个人博客

🔗 阅读原文

🤔 一直以来好像都缺一个能够高度自定义定制化的博客。直到最近才了解到 GitHub Pages 的易用性,着实是有点过于火星人了。

GitHub Pages 自带一个 username.github.io 的域名,同时支持自定义域名。我的域名是在 Namecheap 上购买的,也是这次搭建博客的整个过程中,唯一花了点钱的地方。GitHub Pages 还可以自动为网站添加 HTTPS 证书支持。

🌍 渲染引擎:Hexo

使用 Hexo 可以很方便地把你的 GitHub Pages 博客搭起来。它可以直接一键把所有需要的静态博客页面都部署到 GitHub Pages 上面,这样就不用再担心整体的网站结构、数据库等等。

我们只需要在本地把文章使用 Markdown 写好,然后使用 git commit 或者 Hexo 的一键部署功能就可以直接发布了,所以还是很方便的。

🎨 主题:NexT

Hexo 有多款主题可以选用,我选用的是 NexT,也算是非常经典的 Hexo 博客主题了。经过多年的迭代发展,NexT 已经非常成熟,文档也非常详尽。

🔢 IDE:VS Code

Hexo 和 NexT 的配置都使用 YAML 语言。为了编辑它,顺带可以在一个稳定本地环境中管理 GitHub Pages 仓库,我还是用 VS Code。它可以代码高亮、AI co-pilot,还内置终端。

🆓 如果你也需要一个轻量化、静态的个人博客,不如试试 GitHub Pages,几乎零建站和维护成本,就可以搭起来一个看起来十分专业的站点了。现在有了 AI 和 agents,你也可以完全抛弃上面的方式,直接「手搓」整个网站,也不是不行!

频道:@NewlearnerChannel via Kostya’s Lair
4👍1👀1
#macOS #GitHub情报

🧊 Thaw:macOS 菜单栏管理工具的新继任者

🔗GitHub

⭐️ Features:

• 隐藏、展开和重新排列菜单栏
• 支持单独的常驻隐藏区和 Bar
• 可自定义菜单栏外观
• 原生开发,开源免费

macOS 的菜单栏一直都是个很微妙的区域。一方面它几乎承担了大量后台工具的常驻入口,各种服务的图标都想往上挤;另一方面系统本身对菜单栏项目的管理能力又很有限,尤其是在刘海屏上可用空间被进一步压缩之后,图标拥挤、遮挡和排序混乱就更容易变成日常烦恼,尤其对我这种强迫症而言。也正因为这样,菜单栏管理这个赛道一直不缺需求,但真正顺手、稳定、又让人放心的选择并不算多。macOS 26 时代虽然终于可以管理一下菜单栏项目了,但这个原生的管理功能又过于羸弱。

过去很多人默认会选 Bartender,但在被收购之后,这个老牌工具的处境一下子变得有些微妙了。收购方过往的一些争议记录,让不少用户对它的信任迅速下降。对于这类拥有较高系统权限、长期驻留后台的工具来说,信任本身就是产品体验的一部分。也正是在这之后,Ice 这类开源替代品迅速获得关注,菜单栏管理这个原本有些沉寂的品类又重新热闹起来,但是很可惜 Ice 昙花一现之后又归于沉寂。Thaw 从 Ice 分叉出来,修 bug、跟进新版本 macOS 兼容性,完成 Ice 未竟的事业。

从功能上看,除了最基础的隐藏/显示菜单栏项目,Thaw 还支持拖拽排列、搜索菜单栏图标、自动重新隐藏,以及在刘海屏 Mac 上把隐藏项目放到单独的栏里显示。另外,Thaw 还提供了对菜单栏外观的控制,比如颜色、阴影、边框、圆角这些视觉层面的定制。从这些上面看,Bartender 的功能 Thaw 都实现了。

👀 其实最重要的并不是 Thaw 实现了多少功能或者添加了多少新功能,而是 Thaw 在这个节点上提供了一个还算让人安心的开源延续方案。菜单栏管理工具这种东西看着不大,但因为要长期驻留后台、处理系统级界面,又往往需要较高权限,一旦进入工作流,稳定性、兼容性和信任感往往比炫技更重要。当然,这类工具也不是所有人都需要;如果你的菜单栏本来就很干净,或者根本不在意顶部那一排图标,那 Thaw 对你的意义不会太大。

频道:@NewlearnerChannel
👍145
#GitHub情报 #Web #Music

🎸 Interactive China Music Map:中国独立摇滚地图

🔗GitHub | Web

👉 Features

- 用地图标记乐队或城市,可视化展示
- 介绍乐队风格、社交主页及联系方式
- 列举不同地区的演出场地、排练室等

🎤 看到了很喜欢的乐评网站 UPEE 的推荐,才了解到有人在做一份线上的中国独立摇滚地图。从地图上颜色的深潜,可以对已经收纳乐队的地区分布情况有一个大致了解:长三角、北京、四川、河南、广东偏多些

💡 点击不同地区,可以详细了解乐队的具体情况,以及该地区演出场地和排练房(周边)的分布。如果遇到你感兴趣的摇滚风格,也不妨直接点开网易云进行收听。正常使用这份地图之外,无论是提交收录还是更正信息,都可以联系开发者

👀 不过,「独立摇滚」的流派众多,有 Indie、Post-punk / rock、Shoegaze、Noise、Art Rock、Math Rock、Emo、Electronic、Alternative Pop、Garage、Bedroom、Afro Rock 等等;此外,开发者 base 杭州,对其他地区了解可能不是很多。这些导致了这份地图目前还是远远不够的,需要大家去补充

譬如,南京的场地除了蛋吧,还有 1701 Livehouse、稻香音乐空间、陶谷公园等(越来越多的私人空间公共化);南京的乐队除了列举的这些,还有 P.K.14、Schoolgirl Byebye、野外合作社、冷冻街等。万事开头难,一步一步来,还是很高兴有人开始做这些事

🧑🏻‍💻 开发者的话

中国独立摇滚地图正式上线了!因为是手动录入信息所以乐队、场地还不那么全,更多是 Catbeer(注:猫啤,来自江浙沪的独立音乐厂牌)一起演出过的乐队。支持添加乐队和场地的基本信息 / 联系方式,希望可以方便大家找演出场地以及拼盘乐队

除了乐队、场地外,我们新增了「排练房」与「城市角落」两个新面板,排练房用于展示各地的排练房信息,城市角落则用来分享各个地区朋友们开的有趣的小店(唱片店 / 咖啡店 / 理发店…)

代码已开源,欢迎 PR / Star / Fork,需求 & Bug 也可以提 Issue。期待大家补充更多相关信息!

频道:@NewlearnerChannel
13
#macOS #Windows #GitHub情报 #Tools

🎬 OpenScreen:免费开源的 Screen Studio 替代品

🔗Web | GitHub

⭐️ Features:

• 录制指定窗口或整个屏幕
• 支持自动或手动缩放,突出操作重点
• 支持麦克风和系统音频录制
• 可裁剪画面、添加文字/箭头/图片标注
• 支持片段裁切、变速以及多种比例和分辨率导出
• 开源免费,可个人和商业使用

这几年做产品演示、录教程、发更新视频几乎已经成了独立开发者和创作者的基本功。问题是,这类需求虽然越来越普遍,但真正做得顺手的工具并不便宜。Screen Studio 的效果大家都有目共睹,缩放、运镜、背景这些细节一开,录出来的视频确实比原始录屏好看很多;但月付 29 美元的价格,对很多只是偶尔录个 demo 的人来说还是有点肉疼 -- OpenScreen 也正是在这种背景下出现的。

从功能上看,OpenScreen 已经把这类工具最核心的部分覆盖的比较完整了。录窗口、录全屏、自动缩放、手动加 zoom、录麦克风和系统音频、加标注、裁切片段、调整速度、导出不同尺寸,这些高频功能 OpenScreen 都可以满足。如果只是计划做一个好看一点的产品演示、功能 walkthrough,或者给应用录一段更新展示视频,OpenScreen 基本已经够用。不是每个人都愿意为了几段 demo 视频长期订阅一款软件,也不是每个人都需要专业级的视频包装能力。OpenScreen 这种工具就是给“想把录屏做得稍微体面一点,但又不想为此单独养一项订阅”的独立开发者准备的。

🤔 当然,OpenScreen 现在还在 Beta 阶段,难免会有 bug,稳定性和完成度也肯定还不能和成熟商业产品相比。另外 OpenScreen 是 Electron 路线,如果你是那种很在意原生感、性能和系统一致性的专业用户,大概率还是会更偏向付费的成熟方案。以及说到底,这类开源替代品都有一个“能不能持续活下去”的现实问题。如果你只是想找一个免费、开源、没水印、没有订阅包袱的录屏演示工具,OpenScreen 确实很值得试试。

频道:@NewlearnerChannel
👍54
#App #Github

📸 Capso:免费开源的 macOS 截图与录屏工具

官网 | Github

CleanShot X 的免费开源替代品,用 Swift 6 原生构建,功能不缩水。

特点

• 全模式截图:支持区域、全屏、窗口三种截图方式,区域截图实时显示尺寸标注,窗口截图单击即可捕获
• 录屏 + GIF:同时录制 MP4 视频和 GIF 动图,支持系统音频 + 麦克风双通道采集,3-2-1 倒计时启动
• 摄像头画中画:录屏时叠加摄像头画面,提供圆形、方形、竖向、横向 4 种形状,可拖拽调整位置和大小
• 高级标注编辑器:箭头、矩形、椭圆、文本、自由画笔、像素化模糊、高亮笔、编号计数器,配色器 + 撤销重做一应俱全
• 截图美化:添加背景色渐变、内边距、圆角、阴影效果,支持 Solid 和 Liquid Glass 两种风格,实时预览
• OCR 文字识别:即时 OCR 模式选区即复制,视觉 OCR 模式高亮文字区域可逐块点选
• 钉到屏幕:截图可固定为置顶悬浮窗,支持锁定模式实现点击穿透,适合做参考对照

⚙️ 机制

Capso 采用纯 Swift 6.0 + SwiftUI 构建,面向 macOS 15.0+,是一个完全原生的 Apple Silicon 应用。其架构亮点在于**模块化 SPM 设计**:主应用只是一个薄壳(Thin Shell),所有核心能力被拆分为 8 个独立的 Swift Package Manager 包,每个包可独立测试、独立复用。

主要依赖:Swift 6.0、SwiftUI、AppKit、ScreenCaptureKit、AVFoundation、Vision Framework、XcodeGen

项目使用 XcodeGen 管理工程配置,8 个 SPM 包各自独立编译测试。开发者可以单独将 CaptureKit 或 AnnotationKit 嵌入自己的应用,这是 Electron 或 Tauri 方案无法提供的粒度。代码风格整洁,遵循 Swift 6 Strict Concurrency 规范。

👨🏻‍💻 使用场景

• 独立开发者制作 App Store 素材:用截图 + 美化功能快速生成带圆角、阴影、渐变背景的宣传图,无需打开 Figma
• 技术博主录制教程:GIF 录屏 + 摄像头画中画 + 标注编辑器,一套工具完成从录制到标注的全流程
• 预算有限的用户:获得与 CleanShot X($29)同级别的功能,完全免费,无试用期、无功能阎割、无订阅

🛣️ 路线图

• Spotlight / 放大镜 / 标尺工具:标注工具集持续扩充
• 滚动截图:基于 Accessibility API + Vision 拼接长页面
• 视频裁剪编辑器:录屏后直接在应用内剪辑
• 截图历史浏览器:回顾和管理历史截图记录
• Raycast / Shortcuts 集成:URL Scheme 自动化工作流支持

💬 社区评价

Capso 于 2026 年 4 月 10 日开源,目前在 GitHub 上已获得 238+ 星标,Fork 数 16,由 1 位核心贡献者开发,已发布 7 个版本(最新 v0.1.9)。在 Product Hunt 上线首日获得 261 票,30 条评论,拿下当日 #3 Product of the Day。

社区整体评价非常正面。用户最喜爱的是「免费 + 开源 + 原生 + 功能完整」的组合,主要改进建议集中在稳定性打磨和缺失的高级功能(如滚动截图)。


🖊️ 作者背景

Kevin (lzhgus) — 独立 macOS 开发者

Awesome Mac Apps 创始人。旗下已有 MacQuit($4.99)、ImageMini Pro($9.99)、Gauss($4.99)等多款付费 macOS 原生工具。

频道:@NewlearnerChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
17
#GitHub情报 #Design #Web

🎨 基于数学曲线的加载动画集

🔗GitHub | Web

👉 Features

- 基于数学曲线生成的加载动画(不是手写关键帧)
- 多种曲线类型(正弦 / 螺旋 / 利萨如等风格)
- 丰富的参数控制,为动画带来实时变化
- 纯前端实现,所见即所得,支持多种形式导出

💡 在小红书冲浪的时候,发现了这个个人项目。作者使用数学公式曲线运动做动画,还增加了玫瑰、心型曲线的动画,并对每个动画增加了配置项,大家可以尝试调整出自己想要的效果

👀 这个项目无疑结合了数学、动画和 UI,让我们能够自行探索函数与前端的美。大家可以将它们用在Demo / 展示页、加载动画或艺术项目之中,我也向 GPT 发出了询问,得到了另外一些同样很优美有趣的可视化图案代码。可以说,AI 极大程度上方便了普通人去发现美、创作美

🧑🏻‍💻 人终究是视觉动物,近年来各类可视化网页做得越来越精美,短视频也牢牢抓住了人们的眼球。从中挑选出一些适合自己审美的,细细挖掘,背后的原理也十分有意思

📘 关联阅读:

1️⃣ 介绍两个有趣的地铁网页可视化项目
2️⃣ Aeris:实时 3D 航班飞行可视化网页
3️⃣ NO DAYS OFF:Adrien Friggeri 和他的跑步可视化网站
4️⃣ Bartosz Ciechanowski 和他的博客

频道:@NewlearnerChannel
👍142
#macOS #GitHub情报 #Tools

🏝️ SuperIsland:Mac 刘海变 Dynamic Island

🔗Web | GitHub

⭐️ Features

• 显示音乐、电池、天气、日历和通知
• 支持文件拖放到刘海区进行分享/传输
• 可替代系统音量/亮度 HUD,交互更集中
• 提供 JavaScript Extension SDK,可自行扩展模块
• 开源、免费

iPhone 上的 Dynamic Island 当年一出来,大家一边吐槽刘海,一边又不得不承认苹果确实把一个原本碍眼的硬件缺口包装成了可交互的信息入口。MacBook 也有刘海,但这么多年下来系统从没利用过它,成了实实在在的挖掉一块菜单栏。这几年也有一些商业化的 app 尝试把 Dynamic Island 概念 引入到 Mac,但是对于这种纯纯玩具还收费的 app 是没什么兴趣的。SuperIsland 最大的最吸引人的地方,我觉得还是开源和免费。

目前 SuperIsland 完成度较高,可以显示正在播放的音乐、电池和充电状态、日历事件、天气、通知,以及音量亮度这类本来就只会短暂出现的系统反馈。这些处理是相对合理的,这种轻量信息也只需要简单但频繁的看看,这某种程度上算是终于给 Mac 的 notch 找到了一个还算说得过去的用途。

SuperIsland 还留了扩展接口。项目提供了 JavaScript SDK,开发者可以不用碰太多原生 SwiftUI 细节,直接写自己的模块,这就让它从一个“有趣的小玩具”稍微往“可持续折腾的平台”靠近了一点。像番茄钟、状态监控、AI 统计信息这类东西,理论上都可以继续往里塞。对于喜欢折腾菜单栏、桌面层小工具的人来说,这种开放性会比单纯内置几个功能更有吸引力。

🤔 当然,这类项目也有很现实的限制。不是每个人都需要在刘海区再放一层信息;其次这类常驻系统顶层界面的工具,对稳定性、性能和权限处理都很敏感,做得酷不算难,长期用下来不烦人才更难。MacBook 这块多年被浪费掉的刘海,能不能被重新设计成一个有点意思的交互入口,SuperIsland 还是非常值得尝试的。SuperIsland 还有另外一个项目 SuperCmd 我们也介绍过。

📘 关联阅读:Vibe Island - 把 MacBook 刘海变成 AI 编程代理的实时控制面板及同类项目

频道:@NewlearnerChannel
👍81
#GitHub情报

HelloGitHub:面向入门爱好者的开源项目月刊,近日更新第 121 期

🔗官网 | GitHub | 投稿

✏️ 第 121 期 已经发布

systeminformer:免安装的 Windows 监控工具
KillerPDF:免费开源的 PDF 编辑器
OrcaSlicer:支持多品牌 3D 打印机的开源切片软件
OpenTickly:开源的时间追踪与管理工具
ACGTI:二次元版 MBTI 测试网站
animal-island-ui:动物森友会风格的 React 组件库
MicYou:把 Android 手机变成无线麦克风
abtop:像 top 一样监控 AI 编程助手的工具
cc-switch:一键切换 AI 渠道配置的工具
caveman:让 AI 编程助手少说废话
huashu-design:一句话生成能交付的设计稿
BetterCapture:免费开源的 macOS 原生录屏工具
PhoneClaw:运行在 iPhone 上的本地 AI Agent
paseo:随时随地管理多个 AI 编程助手的平台

频道:@NewlearnerChannel
👍61
#App #Github

😁 Happycapy: 在浏览器里跑 Claude Code 的「Agent 原生电脑」

🔗官网 | 文档 | Github

把 Claude Code/OpenClaw 装进浏览器沙盒,给非开发者一个看得见、点得动、能托管的 AI 工作台。

特点

• Claude Code/OpenClaw 直接在浏览器里跑:不装客户端、不配 API Key、不学命令行,打开网页就能用 Claude Sonnet 4.6 / Opus,Minimax
• GUI 取代 CLI:能看到 Agent 在屏幕上点哪里、改哪个文件,过程可视化、随时介入。
• 每个用户独立云沙盒:Pro 给 2 核 / 4 GB / 50 GB,Max 给 4 核 / 8 GB / 200 GB,文件不会碰本地系统。
• Skills 即软件:内置 40+ Claude Code 兼容 Skills,覆盖 PDF、设计、视频、爬虫、社交发布,可调用 150+ AI 模型。
• Capymail 异步交付:长任务跑完结果发到邮箱,回邮件继续派活,像跟一个远程同事协作。
• Agent Teams(Max plan):多 Agent 团队带 GUI 协作,目前 Research Preview 阶段。

⚙️ 机制

Happycapy 把 Claude Code/OpenClaw 部署在云端隔离容器里,每个登录用户拿到一个带持久化的文件系统。前端实时把 Agent 的步骤投到浏览器,用户用自然语言操作,Agent 在沙盒里调用 Skills 完成任务,结果可以直接展示也可以通过 Capymail 邮件送达。

开源仓库 Happycapy-skills(MIT,85 星,16 fork,7 位贡献者)以收录和适配上游 Skills 为主,自研代码不多;核心沙盒和路由层闭源。

👨🏻‍💻 使用场景

• 非技术同事做内容生产:市场同学描述「给我做一份 8 页产品发布 PPT,配封面图」,Agent 在沙盒里调 pptx 和 canvas-design Skills,30 分钟跑完发回邮箱。
• 个人开发者快速搭原型:开发者把 PRD 丢进去,Agent 调 next-best-practices Skill,写完代码直接在沙盒里跑前后端服务,不占本地端口。
• 研究员处理大批量数据:把一份 50 MB 的 CSV 上传,让 Agent 用 Python 清洗、画图、生成报告,结果以 PDF 邮件发回。
• 小团队跑日常自动化:把每周一抓竞品价格、整理成飞书表设为 定时任务,Agent 在沙盒里定时执行。
• 创作者多平台分发:用 happycapy-social-publisher Skill 一键把同一条内容改写后投到 13+ 社交平台。

🛣️ 路线图

• IOS App 公测:目前 Max plan 早鸟可用,预计 2026 年中开放给 Pro 用户。
• Agent Teams 正式发布:当前为 Research Preview,需要解决多 Agent 协作时的成本和稳定性。
• 更多 Skills 收录:开放外部贡献,Happycapy-skills 仓库持续合并社区 PR
• 企业版 / Team 计划:目前只有个人版,社区呼声较高的方向是协作沙盒和 SSO。
• 本地文件桥接:用户最常吐槽沙盒访问不了我电脑里的文件。


💬 社区评价

Happycapy 于 2026 年 2 月 11 日上线 Product Hunt,当天拿下 #1 Product of the Day。上线 20 天 ARR 突破 100 万美元,背后公司 Trickle 在 2025 年第四季度完成 1000 万美元以上融资。

> 我们正在从跟 AI 聊天走向用 AI 操作,赢家会是那些能把自动化做到可复用、可观测、默认安全的平台。Skills as the new software 这件事 Happycapy 押对了

> Happycapy 解决的是本地跑 Agent 的摩擦力。不用配 server、不用管 API Key、不用学 CLI,打开浏览器就开始。

> Claude 4 Sonnet 4.6 + 长期记忆 + 50+ Skills,每月 17 美元,目前 AI 订阅市场里性价比最高的方案,最接近真正的 AI 同事。

社区整体评价正面。最受欢迎的是先验证后执行机制(先读文件再改、先看目录再建)和可视化沙盒。主要改进建议集中在本地文件桥接、移动端覆盖、credit 用量透明度上。

🖊️ 作者背景

👤 Jarod Xu - Co-founder & CEO

• 教育:北京大学 MBA;南京邮电大学 通信工程 学士
• 职业经历:Trickle Co-founder & CEO(2018 至今,连续创业,做过 5+ 产品);Ericsson Consulting Manager(2013–2017);Ericsson Integration Engineer(2010–2013)
• 背景:早期 3 年烧掉 300 万美元做了 5 个失败产品后,2024 年 12 月把 Trickle 重做成「自然语言 → 全栈应用编译器」上线 Product Hunt,再用 14 天做出 Happycapy 第一版。

👤 Victoria Wu - Co-founder & Designer

• 教育:北京大学 MBA(2016–2018)
• 职业经历:Trickle 联合创始人 / Design 负责人(2018 至今);Happycapy 联合创始人 / Designer
• 背景:主导产品视觉与交互,Capybara 形象和「Happycapy, HappyYou」品牌主张出自她手。

💰 定价

• Free:$0,有限 credits、Claude Code、MiniMax M2.7、150+ 模型、基础沙盒、自定义 Skill。
• Pro:$17/月(年付)或 $20/月,2000 credits、沙盒 2 核 / 4 GB / 50 GB、自动任务执行、Capymail。
• Max:$167/月(年付)或 $200/月,模型不限量(每周刷新 credits)、4 核 / 8 GB / 200 GB、iOS App 早鸟、Agent Teams(Research Preview)、优先客服。

定价对标 ChatGPT Plus 和 Claude Pro ,但拿到的是带沙盒的 Agent 而不是 Chat。

频道:@NewlearnerChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍1
#GitHub情报 #AI #telegram #bots

📩 接读者来稿,他向我们介绍了自己开发的 AI 股票分析机器人项目

📈 TradingAgents-Telegram:基于 AI 股票分析的 Telegram 助手

🔗GitHub

⭐️ Features

• 基于 TradingAgents 框架
• 支持通过Telegraph输出股票分析、市场情绪总结与观点
• 可以直接通过 Docker Compose 部署

🧠 最开始是因为我在体验挺火的 TradingAgents 时,发现它原本主要运行在 Terminal 里,虽然功能很强,但日常使用和交互并不是特别方便。所以我尝试把它做成 Telegram Bot,让整个过程更像聊天:你可以直接把股票代码发给 Bot,然后看不同 AI 如何分析、讨论和补充观点。相比传统命令行,这种方式会更轻量,也更接近日常使用习惯。它并不是传统意义上的量化系统,也不是自动交易工具,而更像一个「AI 投资讨论Bot」。

👨🏻‍💻 这个项目本身也是一次很有意思的 Vibe Coding 体验。整个开发过程里,我大量使用了 Claude Code 做协作开发,从需求描述、架构设计到代码生成,很多部分都是通过自然语言一步步完成的。某种程度上,它也是我对「Vibe Coding」方式的一次实践。

⚠️ Disclaimer

这个项目仅用于技术交流与 AI 能力探索,不构成任何投资建议。
AI 输出可能存在错误、幻觉、信息滞后或分析偏差,不应作为实际投资决策依据。投资本身存在风险,请务必独立判断并自行承担风险。

❤️ 欢迎提 Issue 或者给个 Star!

频道:@NewlearnerChannel
13👍2
#App #Github

🖥 Warp:用 Rust 重写的 Agentic 开发环境,从智能终端一路进化到「人类 + Agent 协作」的开放编程平台

🔗官网 | GitHub

2026 年 4 月 28 日,Warp 把整个客户端在 AGPLv3 + MIT 双协议下开源,OpenAI 作为首位赞助方加入,标志着 Agentic Development Environment(ADE)赛道第一次出现完整开源的成熟产品。

特点

- 完整客户端开源:48,000+ 星的 Rust 终端客户端代码全量放出,UI 框架走 MIT、其他部分走 AGPLv3,是当下唯一开放的 ADE 完整实现
- Agent 优先的贡献模型:社区不再只是提 PR,而是提 Issue → 由 Oz 编排的 GPT 模型自动 Spec、写代码、跑测试,人类负责定方向和验收
- 多模型 + 多 Agent 框架内嵌:原生支持 Claude Code、Codex、Gemini CLI、OpenCode,并新增 Kimi、MiniMax、Qwen 等开源模型,以及 auto (open) 路由
- 块状终端 + GPU 渲染:以 Block 为单位组织命令、输出和 Agent 对话,配合 GPU 渲染实现现代化交互体验
- 公开路线图:GitHub Issues 成为产品 Roadmap 唯一来源,所有产品讨论搬到公开仓库,可在 build.warp.dev 查看实时 Agent 工作状态

⚙️ 机制

Warp 的核心是一个用 Rust 写的、围绕「Block」抽象构建的桌面客户端。终端输出不再是字符流,而是带类型的 Block 列表,存放在 SumTree 数据结构中,由 GPU 后端渲染。开源之后,Agent 对话和命令块共用同一份 Block 模型,Oz 在云端编排多 Agent 并行执行任务,再把结果以 Block 的形式回流到客户端。

主要依赖:Rust(占比 98%)、Tokio 异步运行时、Alacritty 终端基线、NuShell 解析、Hyper HTTP、FontKit 字体渲染、Fig Completion Specs 自动补全。

👨🏻‍💻 使用场景

- 重度终端用户:每天在命令行里花 4 小时以上的 SRE、DevOps、后端工程师,可以用 Warp 替代 iTerm2、Alacritty 等老牌终端,获得块化交互、命令搜索和 AI 补全
- 多 Agent 协作开发者:同时在跑 Claude Code、Codex、Gemini CLI 的工程师,可在 Warp 里通过 Vertical Tabs 同屏管理多个 Agent 会话,统一通知和代码审查
- 企业 AI 工程团队:需要把多个 Agent 部署到云端、又关心可观测性和 Build vs Buy 决策的团队,可直接参考 Oz 编排平台和 build.warp.dev 公开仪表盘


🛣 路线图

- GitHub Issues 作为单一事实来源:产品 Roadmap 和 Bug 讨论全部公开,Issues 当前有 3,241 条 Open
- 开源模型路由扩展:继 Kimi、MiniMax、Qwen 之后,预计会持续接入更多开源模型,并扩展 auto (open) 路由的策略
- 可定制化的 ADE 形态:官方明确表示要从「纯终端」、「带 Diff 视图和文件树的轻量 ADE」、到「完整 ADE」做形态分层

💬 社区评价

Warp 于 2026 年 4 月 28 日开源,截至 5 月中旬,GitHub 仓库已获得 48,439 颗星标、3,123 次 Fork、40 位贡献者参与,仓库累计 Open Issue 3,241 条,社区 Slack 专设 #oss-contributors 频道,最近一次代码推送为 2026 年 4 月 30 日。

“开源,本质上是出于我们打造一家成功公司的愿望。我们正在与其他资金雄厚的闭源竞争对手竞争,而我们认为,通过开源并为社区提供改进 Warp 的资源,是一种能够加速产品开发的聪明方式。”
—— Zach Lloyd,Warp 创始人兼 CEO

“长期以来,开源一直是开发者学习、构建以及推动整个行业前进的核心方式。我们很高兴支持这些实验,探索 AI 如何帮助维护者和贡献者以更高效的方式进行大规模协作。”
—— Thibault Sottiaux,OpenAI 工程负责人

🖊 作者背景

Zach Lloyd - Founder & CEO

职业经历:
- Warp,Founder & CEO(2020 年 6 月至今,融资 $73M,团队约 70 人)
- TIME 杂志,Interim CTO(2019 年 5 月至 2020 年 5 月)
- SelfMade,Co-Founder & CTO(2015 至 2019,AI 驱动的营销创作公司,累计融资 $24M)
- Google,Principal Engineer(2007 至 2014,担任 Google Sheets 和 Google Docs 套件的整体工程负责人,长达 7.5 年)
- 早年还在 NASA JPL、Amazon 实习

Warp
- 融资:累计 $73M,2 轮披露,由 GV、Neo、BoxGroup、Sequoia 等机构支持,2026 年开源时引入 OpenAI 作为开源仓库的 Founding Sponsor
- 团队规模:约 70 人
- 产品线:Warp Terminal、Warp Agent、Warp Code、Warp Drive、Oz Orchestration、build.warp.dev
- 愿景:把「开发者和 Agent 协作建造软件」做成行业标杆

频道:@NewlearnerChannel
6
#APP #macOS #GitHub情报 #Tools

📩 接读者来稿,TA 向我们推荐了自己开发的 macOS 代理客户端

ClashBar:原生轻量的 macOS 菜单栏代理客户端

🔗Web | GitHub

⭐️ Features:

• Swift 原生开发,轻量、低内存占用
• 在菜单栏中快速切换全局 / 规则 / 直连模式
• 支持节点切换、系统代理开关和实时上传 / 下载速率显示
• 支持本地 / 远程订阅导入,可手动编辑配置
• 支持开机自启和全局快捷键

Clash 系客户端这些年已经不少了。很多客户端功能很全,窗口也很大,订阅、节点、规则、日志、Dashboard 全都塞在一起;当然这很适合重度用户,但对只是想日常切一下节点、看一下速率、开关一下系统代理的人来说,多少有点杀鸡用牛刀。ClashBar 实现了代理客户端里最基础的功能,比如切换全局 / 规则 / 直连模式、选择节点、开关系统代理、查看实时上传下载速率,以及导入本地配置或远程订阅。ClashBar 使用 Swift 原生开发,目标是比 Electron 客户端更轻、更省电,也更贴近 macOS 的系统体验。

ClashBar 是作者通过 AI vibe coding 做出来的项目。现在越来越多非程序员也能借助 AI 写出可用的软件,AI 确实让很多原本只停留在脑子里的想法有了落地的机会。但另一方面,网络代理工具不是普通记事本,它涉及系统代理、网络流量、后台权限和配置解析,代码可靠性、异常处理和长期维护都需要经得起更多考验。AI 可以把“做出来”的门槛降得很低,但“长期稳定地做好”仍然需要工程判断、测试和持续修补。这大概也是接下来几年我们会反复遇到的问题:当写代码变得越来越容易,真正重要的可能就不只是“谁会写代码”,而是谁能判断代码是否可靠、是否安全、是否值得长期依赖。

频道:@NewlearnerChannel
👍16🥰4🦄21
This media is not supported in your browser
VIEW IN TELEGRAM
#GitHub情报 #APP #Tools #AI

📩 接读者来稿,他向我们介绍了一个有趣的 AI 代理可视化项目

🧩 ascii-agents:把你的 Claude Code 装进一个像素风办公室

🔗GitHub

👉 Features

- 为每段会话设置办公桌,多出的将会展示在地板和沙发
- 为每段会话代表的人物设置丰富的动作和表情
- 通过颜色快速识别状态,并加入多种天气情况
- Office Cat 陪伴左右
- 在人物身上悬停可看到会话详细信息
- 支持 Claude Code 和 Antigravity CLI,未来计划更多平台

👀 看到这个项目,第一反应是想到了令人舒适的 室内白噪音 以及灵感买家俱乐部推出的线上「野乌咖啡馆」。在后者之中,你依然可以化身为一个可视化的个人,在其中听音乐、自习、开会、聊天,做自己想做的事。很好的想法!

🧑🏻‍💻 开发者的话

现在的状态:每个 session 是一个小人,显示器会根据当前在用什么工具自动变色,空闲的趴桌睡觉,闲久了自己走去茶水间。窗外有阴天、刮风、日落的天气变化,内置 Cyberpunk、Catppuccin、Gruvbox、Dracula、Tokyo Night 等 6 种主题。🐱 还有只办公室的猫。

起因是日常工作开始大量用 Claude Code,经常同时跑好几个 session 在不同的项目里。但一个 session 当下到底是在打字、还是在等我点权限、还是早就跑完了我没注意,光看终端输出很难一眼分清。

这时候在 GitHub 上刷到 pixel-agents(VS Code 网页版)和 clawd-on-desk(macOS 桌宠版)两个项目,觉得这种「把 Agent 拟人化」的方向很有意思。但自己日常其实更常在终端和 SSH 里干活,所以就想做个纯终端版本。

项目本身是周末用 Rust 慢慢搭起来的,之前没怎么写过 Rust,顺便当练手了。TUI 用的是 ratatui,像素感来自 24-bit RGB 的半字符块渲染(▀)。Agent 闲下来会用 A* 在办公室里乱走,整个过程也算重度使用了 Claude Code,某种意义上「用 AI Agent 给 AI Agent 盖房子」。

频道:@NewlearnerChannel
👾73
#Photos #GitHub情报 #Tools

🎞 NegativeCutter-135:Lightroom 135 胶片扫描自动裁剪插件

🔗GitHub

👉 Features

- 自动帧检测:识别胶片帧之间的间隙,无需手动标记
- 批量处理:同时处理多张照片,适合整卷胶片 Workflow
- 虚拟副本:为每帧创建独立虚拟副本,保留原始扫描文件
- 精确裁剪:基于图像分析生成像素级精确的裁剪框
- 边界清理:0.3% 微小内收,消除扫描脏边和 bleed

📷 上次聊到,自己买了一台 Olympus OM-1 胶片相机,并且拍了一卷 5219 电影卷送去冲洗。由于除碳和 ECN-2 的工艺比较麻烦,为了保证最终质量,索性上了一台哈苏 X5 扫描仪以获得最高后期宽容度。但冲扫店为了图省事,直接发来了 12 张 135mm 照片为一个合集的大文件,也就意味着他们后期去色罩也是一大张照片一起的,这让我感到很恼火

如果你想避免这种情况,最好找那些愿意拆分照片再分别去色罩的商家。一个更为现实的问题是,我如何快速把这个接近 1GB、含有 12 张照片的大图像进行切分?在咨询群友后,他给了我一份 JSX 脚本,现在看来就是 FilmCrop 项目的再开发。意外得还算好用,基本上把 6x2 的照片都拆分出来了,边框还需要再进行细致的调整

💡 最近偶然看到有网友分享了自己在用的 135mm 胶片裁剪脚本,刚好适配 Lightroom,于是和大家分享一下。开发者提供了一键安装脚本,根据 README 引导安装即可。使用起来也很方便,你可以选择让脚本自动检测帧,也可以指定裁剪帧数。项目采用 NumPy 和 Pillow 检测和处理图像,对于单列 135mm 胶片条来讲,效果还是不错的,但边缘依然需要再处理一下

👀 目前唯一的问题就是脚本并不支持 2 列或多列的大文件自动裁剪,依然会在最中间的位置寻找帧,从而导致输出结果混乱。针对这个问题,我也向开发者提出了 Issue,希望后续得到更好的优化和解决

* 实际上,胶片上扫描仪的时候,一般都是将一卷拆分成若干段(一段常见 6 张)再进行扫描,以上提到的裁剪是冲扫店日常需要处理的事情

📘 关联阅读:记一次奥林巴斯胶片相机的购买与使用(以 Olympus OM-1 及其配件为主)

频道:@NewlearnerChannel
6🥰1
#App #Github

⌨️ Raycast 2.0:键盘党最爱的 macOS 启动器,重写之后第一次跑上 Windows

官网 | 技术深度解析

Raycast 把整个应用底层从 Swift 原生重写为 Swift / C# / Rust / Node / React + TypeScript 的四层混合架构,换来了一份能同时跑在 macOS 与 Windows 的代码库,以及一次完整的产品现代化。

特点

- 跨平台同源:macOS 与 Windows 共用同一份 React 前端代码,但各自保留原生外壳(AppKit / WPF),保证系统调用与外观一致。
- Rust 文件索引:自研索引器在 Windows 上直接读取 NTFS Master File Table,整盘扫描可以在几秒内完成,不再依赖 Spotlight。
- AI Chat with Memory:新版 AI 会自动从历史对话中沉淀长期记忆,识别项目、偏好与目标,跨会话延续上下文。
- WebKit 文本渲染:Markdown、代码高亮、长对话滚动用 WebKit 渲染,复杂排版比 v1 的 TextKit 明显更顺。
- 多窗口产品形态:启动器、AI Chat、Notes、Settings 拆成独立窗口,每个窗口都是单独的原生面板浮在桌面上。
- 类型化 IPC:四个 runtime 之间通过自动生成的 typed stdio 协议通信,编译期就能捕捉跨层调用的接口错误。

⚙️ 机制

Raycast 2.0 的核心是一个明确分层的混合架构:底部的原生宿主负责窗口、输入法、托盘等系统集成;中层的 Web 前端用 React + TypeScript 渲染所有 UI;Node.js 后端承担业务逻辑、数据库与扩展运行时;性能敏感的部分(文件索引、数据层、云同步)下沉到 Rust。团队明确否定了 Electron 与早期 Tauri 方案——前者要在 macOS 上额外捆绑 Chromium,后者当时还不够成熟,无法满足他们对原生控制力的要求。

主要依赖:Swift / AppKit(macOS)、C# / .NET 8 / WPF(Windows)、React、TypeScript、Node.js、Rust、WebKit、WebView2。扩展 API 沿用 React + TypeScript,开发者只需 Web 技能即可上手。

代码质量:Raycast App 本体闭源,但扩展仓库 raycast/extensions 完全开源,是观察其工程实践最直接的窗口。团队在 WebKit 内部细节上做了大量工作——禁用 occlusion detection、用 requestAnimationFrame 同步绘制、覆写 NSWindow.setFrame 接入 Core Animation 防止抖动、预热 emoji 字体;在 Windows 端则单独处理 acrylic 模糊与白屏初始化问题。这种愿意啃原生底层细节的工程取向,让混合栈在体验上仍然贴近纯原生应用。

性能与代价:v1 闲置内存 200 ~ 300 MB,v2 上升到 350 ~ 450 MB(WebContent 120 ~ 200 MB、Node 150 ~ 200 MB、原生外壳约 40 MB)。团队承认这是真实的代价,但强调它是 "bounded and measurable",并把内存优化列为 beta 期间的持续工作。

🛣 路线图

官方在技术博客与 v2 公测说明里给出的方向:

内存与冷启动持续优化:把闲置占用压回更接近 v1 的水平,并为低频窗口设计 "grace periods" 减少冷启动延迟。

Windows 体验补齐:IME、可访问性、拖拽等原生细节继续打磨,覆盖更多 Windows 版本、显示器与硬件组合。

iOS 与云同步深化:iOS App 共用同一份 Rust 数据层与同步 schema,未来会有更多功能在三端拉齐。

AI 能力扩展:以 Memory 为基础,继续围绕 AI Chat、AI Commands、Quick AI 增加上下文与工具调用能力。

Linux 仍未官方化:社区维护 raycast-linux 分支,HN 上有用户呼吁官方合作,但目前官方尚未承诺时间表。


🖊 作者背景

Raycast 由 Thomas Paul Mann(CEO)与 Petr Nikolaev(CTO)于 2020 年在伦敦联合创立。

Thomas Paul Mann:前 Facebook / Meta 工程师,毕业于德国 TH Aschaffenburg 应用技术大学,2020 年离开 Meta 后创办 Raycast,常驻伦敦。
Petr Nikolaev:联合创始人兼 CTO,与 Thomas 一起在伦敦带队。
团队:约 30 人,其中 75% 是工程师,团队完全分布在欧洲。
融资情况:累计融资 4780 万美元。

2020 年 10 月:种子轮 270 万美元,Accel 领投,Y Combinator 参与。
2021 年 11 月:A 轮 1500 万美元,Accel 与 Coatue 共同领投。
2024 年 9 月:B 轮 3000 万美元,用于把产品拓展到 Windows 与 iOS。
知名天使:GitHub CEO Thomas Dohmke、Shopify CEO Tobi Lütke、Vercel CEO Guillermo Rauch。

💰 定价

Raycast 主体免费可用,付费的 Raycast Pro 主要面向需要 AI、云同步与高级主题的用户。

Free:启动器、扩展、Clipboard、Snippets、Notes、窗口管理等核心功能全部可用。

Pro:年付 8 美元 / 月(96 美元 / 年)或月付 10 美元 / 月。包含无限基础 AI 对话(GPT-4o-mini、Claude Haiku 3.5、Llama 3.3)、AI Commands、AI Presets、自定义 Prompt、Quick AI、Cloud Sync 与自定义主题。

Advanced AI 加购:在 Pro 之上再加 8 美元 / 月(合计 16 美元 / 月),解锁 GPT-5、Claude 3.7 Sonnet、o3、o3-mini、Gemini 2.5 Pro 等前沿模型。

频道:@NewlearnerChannel
12👍3
#GitHub情报

HelloGitHub:面向入门爱好者的开源项目月刊,近日更新第 122 期

🔗官网 | GitHub | 投稿

✏️ 第 122 期 已经发布

FluentFlyout:更好看的 Windows 媒体控制弹窗
termshot:一条命令生成终端截图
Recordly:支持自动缩放和光标特效的屏幕录制工具
bleachbit:免费开源的磁盘清理工具
Kami:让 AI 生成的文档值得被打印出来
health-tick-release:macOS 菜单栏久坐提醒工具
whatcable:这根 USB-C 线到底能干啥
codeburn:AI 编程助手 Token 用量分析工具
open-design:Claude Design 的开源替代品
Clawdmeter:展示 Claude 用量的桌面小屏
agentmemory:AI 编程助手跨会话记忆系统

频道:@NewlearnerChannel
👍91🥰1
#RSS #AI #GitHub情报 #Tools

📰 邸报:把推荐算法重新接回 RSS

🔗GitHub | 项目介绍

⭐️ Features:

• 导入 OPML 或 RSS 地址
• 根据阅读行为自动学习偏好
• 支持 Docker Compose 部署
• SQLite 单文件存储
• 无需绑定 LLM API,可接入 embedding 服务或本地模型

RSS 的好处是信息源掌握在自己手里,坏处也是信息源容易古板、陈旧、机械的掌握在自己手里。订阅一多,每天几百篇未读文章堆在收件箱里,阅读很容易逐渐变成一种负担。平台推荐当然省心,但代价是信息分发权也一并交给了平台。邸报在两者之间找一个位置,让信源仍然由用户选择,但排序交给算法完成。导入 OPML、添加 RSS 地址之后,就可以在邸报中像普通阅读器一样浏览、收藏和标记文章。与传统 RSS 阅读器不同之处在于,邸报会根据阅读行为逐渐学习用户的偏好,再对订阅池中的内容重新排序。它不会引入新的信息来源,只是在你已经订阅的文章里,把可能更值得先看的内容浮上来。

这个思路非常合理。现在很多“AI 阅读”产品习惯让大模型直接吞掉整条信息流,逐篇总结、筛选和判断,不仅消耗大量 Token,也容易让阅读变成被模型加工过的二手信息。而邸报选择了另外一条路,通过行为数据、embedding 和排序,已经可以解决大部分需求,每篇推荐还会附带理由,不只是扔给用户一个无法理解的黑盒分数。

部署方面,邸报支持 Docker Compose,可以运行在 NAS、VPS 或本地电脑上。数据保存在 SQLite 文件中,备份基本就是复制粘贴。它不依赖中心化服务,也不强制绑定付费 API。接入硅基流动之类的 embedding provider,或者在本地跑一个小模型,就可以获得不错的推荐效果。

👀 开发者将邸报称作“外部嗅觉器官”,我很喜欢这个描述。RSS 阅读器流行于 2000 年前后,推荐算法在十多年前就已经被大规模验证,但直到今天,两者仍然很少被真正结合起来。邸报目前的完成度和推荐效果都需要更多真实使用来检验。如果你的 RSS 收件箱已经长期处于爆炸状态,又不愿意把阅读完全交给平台算法,邸报很值得试试看。

频道:@NewlearnerChannel
7👍3
#Photos #AI #GitHub情报

🎞 X5-Crop:轻量的 X5 扫描长 TIFF 自动裁切工具

🔗GitHub | Releases

👉 Features

- 兼容绝大部分胶片以及扫描格式:普通 135 / 135 双条片夹 / 半格 / 645 / 66 / 67
- 使用简单:有详细的文档说明,使用方式简洁到只需要双击和回车
- 批处理:一个脚本可以批量处理整个文件夹内的所有 TIFF 图;同时运行多个脚本可以同时处理多个文件夹里的图片,只要电脑内存和硬盘读写足够,上不封顶
- 安全可靠:不对原图作任何修改,输出的裁切图片也严格限制到只做裁切和水平/垂直校准,其余属性绝不修改
- 自动识别与人工审核:能自动识别横图与竖图,只裁切能够被可靠识别的图片,无法可靠识别的情况将会把原图复制粘贴到 needs_review 文件夹以方便人工处理

作为一名冲扫店主,处理哈苏 X5 扫描出来的长 TIFF 是一个高频的场景,不过手动裁切是一件费时费力且枯燥疲惫的事。市面上有着各种各样的裁切工具,在亲自尝试过能找到的所有之后,却总是觉得不能完美地解决自己的痛点:偏手动的效率低下,自动的却常常无法正确识别;又或者是掺杂了许多我完全不需要的花里胡哨功能,裁切的入口太深且不能批处理,反而拉低了效率。

💻 为了解决自己的(还有许多与我类似处境的人)的痛点,我只得自己动手,拿起 Codex 学习做一个 Vibe Coder。用 AI 写代码的过程出乎意料的充满乐趣。最初我以为只是一个非常简单的项目,一天之内就能解决。但是反复的调试验证以及扩充测试样本的过程中,我却发现了这是一件比想象中复杂的事。一开始我只是认为写一个脚本,捕捉到长图中两张图片中间黑色间隔的像素,就能很快很好的完成自动的裁切。但验证的结果却很快告诉我没这么容易:欠曝的图片,叠片,不稳定的片距,片头和片尾。

🤔 这些情况混杂在一起造成了非常糟糕的结果:我甚至需要在自动裁切的产出里去挑选真正可用的图片,很难说这到底是在增加效率还是降低效率。于是在几周的迭代和重构里,我加入了除了间隔检测之外的内容判断、几何修正等等各种 Policy。我也从一名初学者,开始逐渐变得有那么一点点 Coder 的思考方式了。做出来的项目也越来越准确和顺手,让我这个创造者有点自豪,也非常开心帮助到了除了我自己以外的其他人。

💡 现在脚本还有一些不足:比如对于 135 之外的格式没有足够的优化识别参数,对于叠片或者片距不稳定之类的高难度场景只能让脚本临时加 Bleed 或者让人工审核,效率仍然不够高:一张长图的分析裁切需要 10 秒。在这分享出来,也是希望得到更多的反馈让我能够优化和改进,非常欢迎在 GitHub 上提 Issue!至于是否做软件级的封装仍在犹豫中,这一点也需要用户的反馈。

📘 关联阅读: NegativeCutter-135 | Lightroom 135 胶片扫描自动裁剪插件

频道:@NewlearnerChannel
9🤝1