Newlearnerの自留地
58.3K subscribers
12.9K photos
36 videos
63 files
9.78K links
🆕 不定期推送 IT 相关资讯,欢迎关注!

👥 博客群&投稿群&交流群: @NewlearnerGroup

📩 投稿请私信 @newlearner_pm_bot

🔍 频道内容关键词索引 Bot: @newlearner_search_bot

* 未经授权或标注来源,不得转载本频道内容
Download Telegram
#GitHub情报 #AI #Tools #Videos

📹 介绍两个开源的视频翻译 / 字幕添加 AI 项目

随着 Whisper 等 AI 项目的不断发展,许多语音转文本的项目应运而生,有开发者进而结合了 FFmpeg 等项目,推出了视频翻译自动化项目

1️⃣ Chenyme-AAVT

🔗GitHub | Releases

👉 Features

- 支持识别和翻译多种语言
- 支持全流程本地化、免费化部署
- 支持对视频 一键生成博客内容、营销图文
- 支持自动化翻译、二次修改字幕、预览视频
- 支持开启 GPU 加速、VAD 辅助、FFmpeg 加速
- 支持使用 ChatGPT、Claude、Gemini、DeepSeek 等众多大模型翻译引擎

该项目致力于提供一个简便高效且免费的媒体识别与翻译自动化流程,帮助用户快速完成音视频字幕的识别、翻译和处理

2️⃣ VideoLingo

🔗GitHub | Demo

👉 Features

- 使用 NLP 和 LLM 进行字幕分割
- 智能术语知识库,实现上下文感知翻译
- 精确的单词级字幕对齐
- GPT-SoVits 高质量的个性化配音

这个项目的针对性更强:国外视频搬运 + 配音。但是我们希望大家能够通过两个项目,多多学习和提升自己的外语水平,或将视频私下分享给不具备外语理解能力的人

📘 关联阅读:MemoAI - 好用的语音转文字工具

频道:@NewlearnerChannel
#APPLE #AI #GitHub情报 #Blog

🧠 巧用开源项目 misakaX,让你的国行 iPhone 使用 Apple Intelligence

🔗GitHub | Releases

阿果发布会结束后总是很疲惫,所以请允许我水一贴。新系统正式版不远了,而大家终于发现了让我们的国行 iPhone 用上 Apple Intelligence 的方法,今天来分享一下

前排说明,此方法涉及到程序自动修改配置内容,存在一定风险和不安全因素。请大家尝试前慎重考虑,并做好手机备份

🔍 设备与环境要求

① 设备:符合 Apple Intelligence 运行需求的设备,可在官网查询(iPhone 15 Pro 系列和 M 芯片设备)
② 环境:安装 macOS 15 Beta 的 Mac、安装 iOS 18 Beta 的 iPhone 等

💡 操作步骤

① 下载 misakaX 软件并安装 PyMobileDevice
② 在手机运行 快捷指令,将得到的文件传输至电脑,并通过软件选择
③ 将手机连接电脑,勾选 misakaX 重 Apple Intelligence 选项,确认
④ 等待手机重启,完成 Apple Intelligence 初始化

✏️ 更详细的步骤可参考 这篇文章

👀 所以本质上还是通过漏洞修改配置文件,最终绕过地区限制,从而使用上 Apple Intelligence。相比于更加开放的 Mac,iPhone 想要做到这一点还是费了不少功夫。

只是目前 Apple Intelligence 可用的功能也比较有限,传闻许多功能又要跳票至年底。所以目前仅尝鲜娱乐用

📘 关联阅读:

1️⃣ Apple Intelligence · 初体验
2️⃣ 巧用两个开源项目,让你的国行 Mac 使用 Apple Intelligence

频道:@NewlearnerChannel
#GitHub情报 #Tools #Web #Photos #AI

📸 HivisionIDPhoto:轻量级的 AI 证件照制作算法

🔗GitHub | Demo

👉 Features

- 轻量级抠图(纯离线,仅需 CPU 即可快速推理)
- 根据不同尺寸规格生成不同的标准证件照、六寸排版照
- 支持纯离线或端云推理
- Todo:美颜 / 换正装等

😈 每个人都应该去照相馆拍摄让自己满意的证件照,但有时候总是因为这样那样的原因着急用,需要现拍。各平台也不乏通过自拍自动制作标准证件照的小程序,但有些需要付费,有些质量不太高

💡 今天介绍的社区开源项目 HivisionIDPhoto 旨在通过一张你的正脸照片,识别你的人像、抠图并自动制作标准证件照。你可以在 Demo 中自行尝试,选择了尺寸、背景颜色,再上传一张自己的照片即可

👀 同样,社区也有人据此打包了对应的客户端,可在 readme 自行取用。项目全完开源,可自行部署,也提供对应外部 API

频道:@NewlearnerChannel
#Web #AI #Tools

🗣 汉语新解:将一个汉语词汇进行全新角度的解释

🔗Web

🎑 中秋之前看到这个名为「汉语新解」的网页,在 X 上格外火爆。于是也试了一试,感到很有意思,和大家分享一下

💡 用户只需要输入对应的词语 / 成语,AI 就会用批判 / 幽默的语气,生成相关的解释内容,有人称它为「AI 鲁迅」

👀 需要注意的是,这个点子的原作者是李继刚,他也在自己的 即刻 分享了基于 Claude 的代码。而本网页是据此,由第三方开发者搭建而成,供大家免费使用的

🔍 一些示例

• 升职加薪:公司画的饼干,咬一口全是空气。咀嚼梦想的声音,掩盖不了钱包的叹息。
• 调休:强制填补的鸿沟,用假期抹平的裂痕,温水煮青蛙的职场陷阱,让你自以为赚到的时间骗局。
• 人工智能:这个数字时代的"炼金术",把硅片变成了现代点石成金的魔法石。我们用算法织就梦想,却常常忘记了梦的本质是人性的投影。这场智能革命,是否会让我们成为自己创造的镜像世界中的因徒?或许,真正的智慧在于明白:人工智能终究是人性的延伸,而非超越。
• iPhone 16:科技信仰的最新圣物,刷新欲望的年度仪式,用一个肾换来的身份象征。

频道:@NewlearnerChannel
#AI #Web

👨🏻‍⚖️ 分歧终端机:让 7 个 AI 给你们的吵架评评理

🔗Web

😝 我们之前介绍了许多 AI 应用方向,有创意内容生成、证件照制作、毒舌嘲讽、自动翻译等等。而今天的「分歧终端机」则脑洞大开,它试图调解争执、甚至想要评理

🤖 评委阵容可以称得上「全明星」,作者提供了不同类别、不同领域的多位名人,你可以在这里找到苏格拉底、乔布斯、王菲、多啦 A 梦、鲁迅给你当评委

💡 输入争执的话题,挑选评理的角色,各个角色就会给出观点和理由。当两人争执不下时,或许最重要的不是给出准确的谁是谁非的结论,而是让争执者跳出两人的僵持关系,看到更多视角和彼此的局限和合理性。 AI 貌似很擅长做这种模糊且似是而非的事

👀 欢迎就你日常生活中遇到的争执不下的问题向 AI 发问,看看他们能够给出什么样的「理中客」答案。项目仅供娱乐

频道:@NewlearnerChannel
#App #GitHub情报 #AI

😀 Huggingface Chat 的聊天客户端

Features

- 支持加载任意本地 GGUF 模型
- 支持使用 Huggingface 云端模型推理
- 支持网络搜索
- 快捷键呼出

🙋‍♂️ 使用体验

拥有最多开源模型的平台,Huggingface,在推出 Web 版的聊天软件后,终于也推出了 MacOS 桌面版启动器版(尚不支持窗口)。

用户可以在桌面版中和云端的 AI 进行对话,也可以和本地的 AI 模型进行对话。目前用户可以自由倒入本地模型,但云端上不支持倒入任意模型。

本地模型个人使用上还有 Bug, Llama error: SwiftLlama is not initialized。云端模型的速度不算太快,第一个 Token 生成需要 3-5s 左右。相比较,ChatGPT 的客户端只需要 1-2s 左右,Token 生成速度也会更快。

👻 对比

相较于 ChatGPT 客户端,Huggingface 客户端的能力比较局限。目前尚不支持屏幕截图,Agent,上传文件,GUI 等一系列功能。

和 Huggingface Chat Web 相比,功能也非常局限,不支持 Agent,不支持工具,支持的云端模型倒都是 7 个。

🥉 总结

Huggingface 背靠自己的模型平台,开发的 AI 聊天软件能给用户更多的模型选择自由。虽然闭源模型目前开来性能更胜一筹,但对于想要更对隐私的用户来说,Huggingface Chat 桌面版会是众多选择中名字最大的那一个。目前提供同样功能的有 Ollma + 任何 AI 客户端,Ollam Web 客户端等等。

频道:@NewlearnerChannel
#Photos #GitHub情报 #Web #AI

🏞 Text Behind Image:为照片自动添加后置文字

🔗GitHub | Web

🔥 最近有个项目拿到了 Product Hunt 榜一,它的开发者是香港的学生。这个项目叫 Text Behind Image,它的核心十分简单,就是便捷地为照片加入后置文字

💡 通过 Google 登录网页版之后,你就可以上传自己的照片,并对后面的文字进行全方位的自定义。程序会自动识别主体,并把文字放在主体物后面,不会遮挡到它

👏 这么一个简单的程序,是开发者通过 AI 编写出来的,简单但是很实用,因此收获了大家的一致欢迎。恰好我们主编近期也向我展示了自己利用 Cursor 做的文档自动化编写网页程序,十分丝滑

📷 最后,欢迎你去 官方推特 或是这条推送的评论区展示你的作品!

频道:@NewlearnerChannel
#AI #Web #Reading

💡 Zeli:用中文阅读 Hacker News 和 AI 论文

🔗Web

👀 你平时阅读 Hacker News 的方式是什么?有人偏向于直接查看首页,但总是被 UI 恶心到;还有人通过 RSS 订阅,信息有点爆炸;我则是通过 Hacker News Digest 来收取每日精选邮件

👏 Zeli 旨在实时给 Hacker News 首页和 AI 论文生成摘要,并摘出原文最重点的一句,方便你快速挑选出想读的文章。在 Hacker News 板块,你可以通过不同的分类进入查看

🔥 在 RSS 和信息大爆炸的今天,我需要一个这样的地方,每天查看一次、每次看到一些精选文章。之前推荐过类似的产品,比如 Buzzing、比如 Boring Report。其实自留地也一直坚持这样的想法:不一定实时,不一定全面,但一定是人工挑选的精品

📘 关联阅读:分享几个我喜欢的在线信息聚合网站

频道:@NewlearnerChannel
#Android #App #Productivity #AI

🟠 J1 Assistant:当闪念胶囊、锤子便签及 TNT 出生在 AI 时代

🔗 Web

ℹ️ 关于 J1 Assistant

- 由锤子科技前团队成员——传言为罗永浩旗下 AI 初创项目——打造的一款 AI 助理应用,集待办、笔记、短信、搜索及 AI 聊天对话等为一体;
- Beta 版本现已开放官网下载,支持 Android,iOS 版本正在开发中。

功能亮点

- AI 助理:告别繁复指令,用日常对话完成发送消息、创建便签、添加待办等需求;
- 智能便签:还原锤子便签设计,注入 AI 能力 ,一键校对、翻译、调整长度和风格;
- 智能待办:与 AI 助理深度融合,自动创建待办事项,支持时间设置和周期提醒;
- 智能搜索:至多支持四窗口同屏搜索,可切换不同搜索源组合,重现便捷高效体验;

👀 我的看法

对 Smartisan 用户而言,J1 Assistant 的到来无疑是一场久别重逢。从《猛兽派对》的默认头像,到精致考究的拟物设计,再到经典功能的重现,都不禁让人怀疑这是锤子科技前团队蓄势已久的一次回归。他们试图在 AI 浪潮中,将那些曾获得满堂喝彩或嘘声四起的产品重新整合,借助大语言模型的加持,打造一款「更智能、更高效且设计优雅的 AI 助理」。

于是我们看到闪念胶囊式的窗口设计,曾经的灵感记录及待办场景得到进一步拓展;看到 TNT 的「发牌手」在搜索引擎、社交平台、购物网站等搜索源集合中延续,依旧追求着便捷高效的搜索体验;看到锤子便签、子弹短信……

可惜就 Beta 版本而言,J1 Assistant 的表现是食之无味,弃之也未必可惜的,除了 Ripple Touch 的交互算上新颖外,其他的功能无非是对经典产品的一次锦上添花,更何况,这朵名为 LLM 的花在今天,也并不新鲜了。

📍 首发频道小红书Twitter即刻

频道:@NewlearnerChannel
#iOS #macOS #GitHub情报 #AI

🤖 Siri Ultra: 为你的 Siri 接入各种 AI

🔗GitHub

⭐️ Features

- 兼容 OpenAI、Gemini 和 Deepseek 等多种大模型
- 支持部分模型接入联网搜索
- 支持网页总结
- 无需安装其他 App

在 Apple Intelligence 真正普及之前,Siri 的智能性一直是个槽点。就我个人而言,Siri 的常用功能仅限于设置实验计时器。然而,Siri Ultra 的出现,为 Siri 拓展了应用场景。该项目本质上是一个基于快捷指令的脚本,能够连接 Siri 与各类大型语言模型,从而使 Siri 具备更强大的 AI 能力。

Siri Ultra 依托快捷指令运行,可通过语音指令或分享菜单启动,操作相对便捷。若配合 Groq、SambaNova 或 Cerebras 等有超高 Token 生成速度的服务提供商,可获得接近实时的交互体验,整体使用感受较为流畅。

需要注意的是,受模型本身的限制,Siri Ultra 的联网功能并不是任何大模型都可用。该项目开发者同时提供了一项名为 Search1API 的付费服务,可以为部分大模型提供联网 API,可以尝试将 Siri Ultra 与 Search1API 结合使用。

频道:@NewlearnerChannel
#AI #telegram #Coding

🧠 用 Cursor 来做自己的小工具

⌨️ 主编我本身几乎是一个编程小白,除了制作过一些小的网页以外没有怎么写过代码。但是,最近 CursorAI 文本编程软件)的到来改变了这个状况除了写过自己的六十四卦钟以及手搓了一个复习易经内容的假 Duolingo 以外,我决定和它协作,看看如何用它来分析 Telegram 频道的数据

🎢 我觉得 Cursor 非常的初学者友好的原因是,在我建立好文档后,我只用英文 prompt 说「我想要把一个 Telegram 频道的数据拉出来,这样我能分析一下这个频道的流量以及转评赞之间有没有什么规律」(其实你也可以用中文和它对话的)。在那之后,它便帮我写了一个相对应的爬虫,并且告知我我需要先登入 Telegram 去创建一个新 app,然后将 app 的 API key 复制给它

🔑 当 Cursor 获得了 API key 以后,它便自己帮我把爬虫运行起来然后把频道里的所有数据都拉下来了,这整段过程花了大概 30 分钟左右(因为中间有些运行 Python 的步骤花了我一些时间来理解)。严格意义来说,它的任务已经完成了,但是我还没罢休,直接让它帮我分析这些数据里的规律以及洞察,它也很负责任的写了后续的分析工具,并且返回给我了以上的分析结果

📝 同时,我也将爬虫返回的数据 .csv 文档给到了 ClaudeChatGPT,但是却发现 Claude 能给出更多有用的资讯以及建议,原因是因为它也会自己写分析工具,然后返回给我它分析出来的洞察

📒 以上的过程对一位有经验的程序员来说是一个简单到不能再简单的事情了,但是对于像我这样的编程小白来说它简直是打开了新世界大门。接下来,我会想要与 Cursor 一起分析一下我的聊天记录;继续写一些日常能帮我解决问题的小插件;等等

💬 最近,我在小红书上面看到有人说「Cursor 的到来导致了各种各样的垃圾 app 的泛滥」,但是我完完全全不这么认为。发明平板电脑概念的研究员 Alan Kay 一直希望能让所有凡人都在数码世界里面创作(俗称end-user programming),而电脑却变成了一个「消费工具」这件事情让他很难过。在有了最近与 Cursor 协作的体验后,我希望,甚至相信 Cursor 以及它们同类的产品可以改变这个现状,让大家看到代码不再畏惧,随时随地手搓一个自己需要的奇葩工具

📍首发频道作者 Twitter

频道:@NewlearnerChannel
#AI #Coding

🔮 AI 实验 —— 我如何用科幻小说摆脱 AI 新闻焦虑

😵‍💫 这几年有一个很深刻的感受,那就是每日的 AI 产品新闻和模型上的迭代都多到让人麻木了 —— 仅过去一周,就有 Claude 3.7 Sonnet、GPT-4.5、Sesame AI 等重磅模型发布,更不用说数十个新工具和应用。跟不上似乎意味着在技术理解上落后,但追踪这些发展却又耗费大量精力和情绪资源。我实在不是很喜欢这种焦虑感,所以决定尝试来缓冲一下这个焦虑感

🗞️ 我的解决方案是:让 AI 整理每日的技术新闻,并将其转化为一篇短篇小说通过邮件发送给我。我使用 ChatGPT 搭配 Val Town 自动化流程,设计了一个特殊提示词:"请将今天最重要的 3-5 条 AI 新闻转化为一篇 400 - 1200 字的短篇小说。你可以随机选择作家的文笔(如卡夫卡、村上春树或刘慈欣)、自由定义主角背景,以及选择时间点和时代背景。但必须确保故事情节准确反映新闻的核心内容和意义。"于是,这些小说像新鲜出炉的面包一样,每天早上 8 点准时出现在我的邮箱。

🔆 截图里是我这两天收到的短片小说。在经历了几天这场实验后,我发现它带给我了:

︎ 增强参与度: 当信息以有趣的叙事形式呈现,而不是枯燥的标题或技术文章时,我更有可能吸收和场景化这个科技
︎ 更好的记忆保留: 嵌入在故事中的信息往往比单独的事实更容易被记住
︎ 模式识别: 我注意到这些故事中出现了反复的主题——技术公司之间的合作与竞争、开源与封闭战略的拉锯、以及人机交互的逐步融合。这些模式在传统新闻中往往被单一事件的报道所掩盖。
︎ 情感背景: 故事提供了情感背景,有助于我理解技术发展对生活的影响

⚠️ 实验的局限: 当然,这种方法并非完美。有时 AI 会过度简化复杂的技术细节,或者将不同领域的新闻强行塞入同一个故事框架。我发现自己偶尔仍需阅读原始资料来获取更深入的理解。

🔦 如果你也想要试试看的话,可以在评论区留言。我计划建立一个小型社区,每周分享一篇最佳 AI 新闻小说,并探讨如何优化提示词以获得既准确又有趣的故事。你有没有特别喜欢的作家风格想在 AI 新闻小说中尝试?或者有什么特别想通过故事来理解的技术领域?

💡 随着信息过载成为常态,也许我们需要重新思考如何消化知识。在技术和人文的交叉点上,或许存在着更多创新的学习方式,等待我们去发现

📍首发频道作者 Twitter

频道:@NewlearnerChannel
#Web #AI #Tools #Design

📬 new.email:通过 AI 迅速生成电子邮件模板(内测中)

🔗Web | Blog

👉 Features

- 利用 LLM,通过自然语言生成所需邮件模板
- 由 50 多套高质量电子邮件组件库训练而成
- 一致的、美观的、响应迅速的、跨平台的
- 可供所有人使用,不仅仅是开发人员

✉️ new.email 是 Resend 旗下的新产品,你可以理解为 react.emailAI 版本,旨在迅速为开发者和普通用户生成可用的电子邮件模板。在他们刚刚开放 waitlist 的时候我就申请了,近期终于通过,目前产品还处于内测阶段

🧠 实际使用下来,只要你用中文把自己的目的、邮件内容、细节样式说清楚,网站会在很短的时间内为你生成一套电子邮件模板。我以「私密 Telegram 频道邀请函」等内容为主题进行了测试,效果还是不错的

👀 具体来讲,网站生成了一些我没有预料到的内容,比如频道简介还有一些客套话。如果你对于内容文本或是模板样式不满意,还可以继续沟通改进。总的来讲,虽然 new.email 的样式在设计界算不上出众,但适合不会编程的普通人快速生成电子邮件模板,和他们的客户或读者高效沟通自己的产品、文字

👍 如果你有这方面的需求,可以点击网页申请内测,我体验下来还是不错的

频道:@NewlearnerChannel
#AI #Browsers #APP

🧠 聊聊最近很火的邀请制内测浏览器 Dia

Twitter | 小红书

Dia 浏览器由 Browser Company 出品,这家公司也开发了 Arc。

Features

- 主页设有 AI 搜索框,具备类似 ChatGPT 的能力,支持语音输入。支持大语言模型问答与联网搜索。用户可上传文件,或使用其他标签页中的内容作为输入信息。
- 侧栏或者悬浮栏与 AI 进行对话。可以用来总结网页,帮助写作
- 智能 URL 展示,例如 https://www.notion.so/homeless20/Dia-1c484df5d6ec8008ac42ceb0746fa 会展示为 notion.so/Dia

 它可以替代软件内置的 AI 吗?

应该不能。软件内置的 AI 能够调用用户的云端数据库作为上下文,例如 Notion 的 AI 就能利用用户的全部笔记内容进行推理和生成。这类深度集成是浏览器难以实现的。
此外,内置 AI 与软件本身的功能结合更紧密,能支持更多定制化的工作流。这种层级的协同与数据权限,浏览器很难触及,也很难替代。

 它可以替代浏览器 AI 插件吗?

Monica 当前的功能比 Dia 更丰富,支持 Agent,不同模型,悬浮工具栏。但通过将 AI 插件与浏览器深度整合,Dia 能为用户带来更统一的视觉体验。在功能层面是否能超越 Monica 还不好说,毕竟 Chrome 插件也能读取页面信息,甚至修改鼠标高亮的文字。
不过,有些 AI 与浏览器结合的能力,是插件难以实现的,例如:
- 自动执行浏览器操作任务。SimularBrowser 尝试过,但目前体验不佳,速度也偏慢。
- 用 AI 对网页的内容、元素和布局进行重排。
- 将多个网站内容 Remix 成一个全新页面。
- 允许用户选择浏览历史作为大语言模型的上下文输入。
这些能力若能实现,将是插件难以企及的差异化优势。

💲 浏览器的商业化之路还得靠 AI

最后聊聊商业化的可能性。ARC 至今尚未明确商业化路径。早前在推出 Arc Boost 时,曾向用户征询对订阅制的看法。如今推出了全新的 AI 浏览器,或许更有机会走通订阅模式,成为首个真正意义上的订阅制浏览器。毕竟,大多数具备 AI 功能的产品,如 Cursor,最终都选择了订阅制作为主要的商业模式,用户付费意愿也比较高。

频道:@NewlearnerChannel
#GitHub情报 #Chrome #AI #Video

⛔️ Bilibili AI Skip:使用 AI 技术自动跳过 Bilibili 视频广告的 Chrome 扩展程序

🔗GitHub | Web

👉 Features

- 通过 AI 分析视频字幕或音频,精准识别广告并自动跳过
- 支持字幕优先分析,无字幕时可启用音频分析
- 通过 Cloudflare API 查询已缓存的广告数据,提升效率
- 支持设置 API 密钥、模型和跳过模式

💡 使用方法

① 加载扩展到 Chrome
② ​配置 API 密钥(OpenAI 或阿里云)
③ 访问 Bilibili 视频页面,扩展会自动运行,识别广告并根据设置跳过

📺 作为一个 B 站的重度用户,虽然我们都知道它的商业化和用户环境不容乐观,但自己依然无法在国内找到这个「长视频」平台的替代品。既然平台给创作者的收入并不高,他们只能依托平台自己进行一些商业合作

👀 在这个过程中,我看到了一些有意思的广告创意和植入,还遇到了自己用得上的广告产品。但更多情况下,目前的 B 站就是被那几样与「年轻群体」定位不太相符的广告产品以及几个知名电商平台所霸占,可以说查重率相当高

🧠 这篇推送的目的并不是想要引导大家去抵制 B 站的广告,而是提供一个是否屏蔽的选项,选择权在每个人手里。当高质量内容的免费成为了常态,付费就成了一个不情愿的选项,B 站的创作者剩下的选择只有广告了

📘 关联阅读:Awesome Bilibili Extra - 一些让你更愉快地使用 bilibili 的拓展/脚本/程序合集

频道:@NewlearnerChannel
#AI #Photos #Web

🎨 AI Color Match by Polarr Next:在线一键模仿调色

🔗Web

👉 Features

- 上传图像,用 AI 分析并模仿色调,为其他图片一键调色
- 支持导出为图片 / Lightroom Profile / LUT 文件
- 多种预设色调可选
- 登录后免费使用

🌸 今年三月我拍了有史以来最多的春花和人像,但索尼毕竟不像富士、理光等相机有着比较鲜艳独特的色彩,我也不是一个前期完美主义者,于是怎么给这些照片后期调色就成了一个难题

🧑🏻‍💻 后来我基本上花了一整个星期,去给这几百张照片选择适合它们的色调,在 Lightroom 上修修改改,非常疲惫。自己调色的好处就是能够把控每一处细节,使得结果高度符合内心的预期,缺点就是需要一直动脑,并且花费时间太长

💡 今天介绍的 AI Color Match 是 Polarr Next 出品的一个小工具,后者做的就是图片批量 AI 编辑的生意,不过这个小工具是免费的。你可以上传几张自己不太满意色调的图片,去套模板看看效果,个人感觉还是不错的

👀 调色过程中需要注意培养自己的思路和软件使用技巧,这样才能不断进步。如果你只想要通过简单的方式得到想要的色调,无论是 AI Color Match、Imangen AI 还是 iPhone 上面大火的 Dazz 都可以试试

📘 关联阅读:

1️⃣ 1001 个小而美 App:一些也许冷门的复古相机 App
2️⃣ Palette:利用 AI 为图片在线调色

频道:@NewlearnerChannel
#APP #AI

🧠 ChatWise:功能齐全,支持 MCP的 AI 聊天客户端

🔗GitHub | 官网

Features

- 集成搜索功能,支持 Google,Tavily,Exa 等供应商
- Chain of Thoughts,润色,翻译等自定义 Prompt
- 支持上传 文档,音视频等
- 提供 Artifact,生成的 HTML 网页预览
- 支持 MCP 服务器
- 语音生成,语音输入
- 生成聊天截图

🙋‍♂️ 体验

Chatwise 的聊天界面简洁,整体使用体验类似于 ChatGPT 客户端,但不支持通过快捷键快速唤出。

Chatwise 近期走红,主要得益于其对 MCP 的支持。尽管 Claude 是首个支持 MCP 的客户端,但其配置不支持 GUI,仅支持自家模型;而 Cursor 等编辑器虽然支持 MCP,使用门槛较高。由于 MCP 需在本地启动服务器,因此目前主要由桌面客户端支持,大部分 Web AI 聊天工具将在 MCP 更新后再支持。

目前较为热门且支持 MCP 的客户端还包括 5ire、CherryStudio、Deep Chat 和 chatmcp。

⚙️ MCP 体验

大家一般用 MCP 用来做什么呀?

我目前体验下来 Google 家的产品接 MCP 比较麻烦,因为需要设置 OAuth。

用 Notion MCP 来编辑文档,大部分时候不如我直接使用 Notion APP 来的快。因为 AI 无法使用一个 Tool 调用完成,往往需要调用三个(搜索,获取文档,编辑)组合使用,自然增加了很多延迟。这种情况下,就更适合让 Agent 在后台跑着,用 MCP 慢慢的去完成复杂的任务。

Context7 是我很喜欢的 MCP,他为编程场景提供更准确的代码范例。例如你要写 Next.js 的路由,这个工具会帮你获取最新的 Next.js 路由代码范例。

💲 定价

Pro 版本 7 天试用,29 美金买断。提供功能:聊天记录搜索,自定义助手,网页搜索,智能生成内容,工具(MCP),一年专业功能更新。

频道:@NewlearnerChannel
#Browser #Extension #AI

🔎 Complexity:让你的 Perplexity 使用体验更上一层楼

🔗 Chrome Web Store | Mozilla Add-ons | Web

🌍 Complexity 是一款专为 Perplexity 用户打造的浏览器拓展,支持 Firefox 及各类 Chromium 内核浏览器。它提供了许多增强 Perplexity 使用体验的插件,你能够根据自己的需求进行定制,也可以选择预设模版快速上手。主要功能有:

- Canvas:类似于 Claude 的 Artifacts 功能,支持 Markdown、HTML、React 等内容格式的可视化,让你直接在 Perplexity 中实时预览 AI 生成的内容;
- Command Menu:类似于 Spotlight 或 Raycast 等产品,可通过自定义快捷键快速呼出,执行对话记录搜索、前往特定页面或切换主题模式等操作;
- 除此之外,Complexity 还提供了一系列实用的功能增强插件,包括输入斜杠(/)呼出指令菜单、自动记忆 Prompt、更好的代码块显示效果等。

值得一提的是,Complexity 提供了一个名为「Low Performance Mode」的设置项,如果你在日常使用过程中发现明显的页面加载延迟或卡顿现象,那么可开启这一选项来减少性能影响。

🫶🏻 Complexity 目前完全免费使用,并且在 GitHub 上进行了开源。如果你觉得 Complexity 对你有所帮助,开发者 Duong Pham 也提供了通过 Ko-fiPayPal 进行赞赏的渠道,支持项目的持续发展。

📍 首发频道小红书Twitter微信公众号

频道:@NewlearnerChannel
#Photos #GitHub情报 #APP #AI

📷 分享两个与摄影相关的项目

自己买相机也快两年了,通过一路的自我摸索,对于前期和后期慢慢有了一套自己的方法和思路,精选的照片也快要超过 10000 张了。近期看到了两个颇有意思的项目,和大家一起玩一玩

1️⃣ Wuitt:电脑端的胶片管理应用

🔗Web | Dowload

👉 Features

- 专用胶片管理器,支持录入多种胶片型号规格
- 支持录入相机 / 镜头库
- 简单几步便可保存备份你的珍贵记忆,在导入时会自动识别 EXIF 信息,同时可以批量编辑
- 可通过 Dashboard 快速查看过往日期活动

一个很偶然的机会,我刷小红书看到了 Wuitt,开发者是一个目前住在纽约的摄影爱好者。可以看到软件无论从设计还是功能实现,都十分稚嫩,完全不像是 2025 年应该有的软件

但它确实是一个专业爱好者导向的产物,满足了胶片爱好者需要一个专门的软件管理和展示自己作品的需求。开发者还在官网提供了对应胶卷的照片,可以下载然后作为素材库的封面

总而言之,一个小玩具,如果你也喜爱拍摄胶片,可以试一试

2️⃣ AI-PP3:基于 AI 增强的 RawTherapee 配置文件生成器

🔗GitHub | Wiki

👉 Features

- RAW 文件 AI 智能分析(支持 DNG / NEF / CR2 / ARW等格式)
- 批量生成 PP3 配置文件
- 自定义自然语言提示词控制处理参数
- 多模型支持(OpenAI / Anthropic / Google / 本地模型)
- 精细控制 PP3 模块(曝光 / 色彩 / 细节等)
- 带质量控制的交互式预览生成

照片调色软件有很多,但大家常用的还是商业化的那几个,比如 Lightroom 或者 Affinity。今天提到的 RawTherapee 算是老牌的开源照片编辑软件了,它对应的配置文件格式叫做 PP3

本项目虽然也是玩具属性比较强,但看上去靠谱了许多,它的核心功能是通过 AI 进行「一键调色」。喂给它一些照片,它来分析曝光、色调等信息,并生成对应的 PP3 文件

使用它需要有一定的命令行使用基础,如果你觉得有些知难而退,目前商业化的 AI 调色平台也越来越多。AI Color Match、Imangen AI 等我们此前已经介绍过,前不久去河流音乐节,看到官方使用 谱时 这个平台做照片实时推流和 AI 简单调色,也很不错

📸 最后,希望大家都能顺利「出片」。如果你在摄影和调色过程中遇到了好玩的项目,欢迎和我们分享!

频道:@NewlearnerChannel
#telegram #Bot #GitHub情报 #AI

📩 接读者来稿,TA 向我们介绍了自己使用 AI 开发的 Telegram Bot

🤖 Misaka0:模块化 Telegram Bot

🔗GitHub | Demo Bot

👉 Features

🧩 模块架构:功能模块化,易于扩展和维护
🛡️ 权限管理:超管、群管和普通用户权限控制
🔒 群白名单:只有授权的群组可以使用
📱 会话管理:模块间会话控制,互不干扰
📄 分页显示:标准化的分页导航系统,支持页码跳转
🐳 容器支持:轻松部署和维护

💡 此前我们介绍过许多开源的 Telegram Bot,它们很多都负责较为单一的任务,譬如 RSS 订阅、频道内容检索、天气查看等等。而 Misaka0 则采用了模块化的思路,集成了许多使用功能

👀 通过它,你可以和 AI 对话、查看天气、使用 RSS 订阅、下载贴纸、获取汇率等等。想要查看它的所有功能,可以移步 Demo Bot

🧑🏻‍💻 开发者的话

本项目 99% 由 AI 生成,作为维护者,我缺乏专业知识以及开源项目经验。因此,针对本项目的 Issue 或 Pull request 不一定会被处理

欢迎按照 MIT 许可证自由复制和修改此项目以供您自己使用

频道:@NewlearnerChannel