Newlearnerの自留地
55.4K subscribers
11.3K photos
30 videos
62 files
8.54K links
🆕 不定期推送 IT 相关资讯,欢迎关注!

👥 博客群&投稿群&交流群: @NewlearnerGroup

📩 投稿请私信 @newlearner_pm_bot

🔍 频道内容关键词索引 Bot: @newlearner_search_bot

* 未经授权或标注来源,不得转载本频道内容
Download Telegram
#Search

多吉搜索:简单易用清真的搜索引擎

https://www.dogedoge.com/

开发者做了100天,现在有了几百万的累积搜索总量。最近新增了天气查询功能

试着用了一下,感觉还不错。搜索结果虽然还是严格按照中国法律规定来的,但是没有广告,没有竞价,对博客等个人平台十分友好。可以作为临时的替代品

开发者的理念、做引擎的初衷是和对未来的展望也让我产生敬意

👉 多吉搜索目前的情况和感想总结

频道:@NewlearnerChannel
Newlearnerの自留地
Photo
#Search

多吉搜索:简单易用清真的搜索引擎近期更新了 index logo,可爱的狗狗

https://www.dogedoge.com/

此外应该是去除了首页的天气,搜索页的图标还没有更换。总的来说是一个很简洁的搜索页,对个人站长也很友好

收录本站且赋予应有权重的都是好引擎(确信

频道:@NewlearnerChannel
Newlearnerの自留地
#Search 多吉搜索:简单易用清真的搜索引擎近期更新了 index logo,可爱的狗狗 https://www.dogedoge.com/ 此外应该是去除了首页的天气,搜索页的图标还没有更换。总的来说是一个很简洁的搜索页,对个人站长也很友好 收录本站且赋予应有权重的都是好引擎(确信 频道:@NewlearnerChannel
#Github情报 #Search

xinahn(信安):一个开源,高隐私,自架自用的聚合搜索引擎

后端源码 | 前端源码 | Demo

👉 Features:

- 开源前端和后端,可自己架设
- 无追踪,去广告
- 聚合多个搜索引擎:谷歌、bing、知乎、百度、百度知道、百度百科

后续还打算加入多吉、360 和搜狗。本站收录情况不太好,倒是可以找到一些我的友链和 ctrl+c/v 用户

频道:@NewlearnerChannel
#News #Google #Search

Google 今天发布了年度热搜榜以及「Hero」为主题的视频

🔍 年度热搜词:Heroes(英雄)

🎬 年度视频:Google - Year in Search 2019

以英雄为主题的年度总结视频中,谷歌为我们带来了《复仇者联盟:最终之战》中的漫威英雄,还有生活中平凡的个人:消防员、运动员、外卖小哥…大家渴望英雄,而每个人也可以做自己的英雄

当然,谷歌还制作了一个网页,以展示从「全球」到「国家和地区」在 2019 年的热搜词排名:Google Trends

频道:@NewlearnerChannel
Newlearnerの自留地
#telegram #Bot #Github情报 telegram-search:一个支持中文频道/群组搜索的 TG Bot Github | Telegram Bot 👉 Features: - 中文分词引擎 - 可按日期搜索 - Telegram Bot 前端 - 可拓展的定制化搜索引擎 👉 使用:直接输入关键词即可,搜索支持 Lucene 语法 每日速览 +每日速览 +date:2019-12-25 +每日速览 +date:[2019-12-25 TO 2019-12-30] 之前为了解决…
#telegram #Channel #Search

🔍 本频道很荣幸地从即日起被 sssoou.com TG 频道搜索引擎收录并展示于首页

👉 使用方法:传送门

点击之后会自动跳到搜索引擎网页并自动勾选本频道,接着在搜索框输入关键词即可

sssoou.com 是 TG 优质的频道搜索聚合引擎,旨在帮助大家更快搜索🔍频道内容,有助于解决原生对中文搜索不友好的问题

👏欢迎大家前往网页使用或者在 @sssoou_resource 搜索。此前制作的自留地导航我会一直维护,对分类有要求的朋友可以前往:自留地导航

频道:@NewlearnerChannel
#telegram #Bot #Search

🔍 TG 中文搜索一直被大家所诟病,这其中有一些原因,但归根结底不好用。为了给大家带来更好的搜索体验,自留地一直在探索优化的方法。我们在每条消息添加 Tag,将英文前后空格便于搜索,但收效甚微

更进一步的,我们为时效性不强的、偏干货性质的消息做了 自留地导航,和 sssoou.com TG 频道搜索达成了合作。以上措施极大地方便了本人、主编和各位订阅者搜寻频道消息。今天,我将完成整个体系的最后一环:「自留地索引 Bot」,让大家不出 TG、无需打开网页即可完成频道消息搜索

🤖 自留地索引 Bot:@newlearner_search_bot

项目使用了此前介绍的 telegram-search,在部署过程中遇到了一些问题,一并和大家分享解决过程:

1️⃣ 运行 python main.py 前,需手动在 clone 文件夹建立名为“session”的文件夹
2️⃣ 针对小内存(512 MB、1 GB)服务器,建议开启 1G Swap,否则可能将无法启动程序
3️⃣ 运行命令 sysctl -w vm.max_map_count=262144,并在 docker-compose.yml 里面的 elasticsearch 加入 ES_JAVA_OPTS=-Xms512m -Xmx512m
4️⃣ 搜索结果长度可以自由设置,前往 main.py 修改(默认 15 字符),运行 docker-compose builddocker-compose up 即生效

👀 希望大家可以通过这个机器人找到自己想要的信息,目前发现的问题是受搜索结果长度限制,有时不能很好地反映出整条消息的大意;此外机器人会将关键词自动拆分成几个词组并分别搜寻汇总,导致结果数量庞大,使用时请将每个关键词分开并在前面添加

例如:“+iPhone +Android”表示寻找一条既包含“iPhone”又包含“Android”字段的消息(即 Lucene 查询语法)

❤️ 感谢开发者 EEYHN 的耐心指导,也欢迎大家在使用过程中向我们提出建议

频道:@NewlearnerChannel
#telegram #Search #Bot #Blog

Telegram 中文搜索方案探索(频道)

🔍 这篇文章将从 Telegram 中文搜索现状、逻辑,另辟蹊径的搜索方案和各种方案横向对比等角度出发,让自留地的读者朋友了解到,为了做好本频道的搜索我们做了哪些努力和尝试

因此不再啰嗦地细数,感兴趣的朋友可以直接阅读。私以为鉴于英语的句式组成,短期内 Telegram 并不会做出有建设性的改善。请注意上述方案只针对单个群组/频道,也欢迎大家来稿谈一谈你目前的方案

📝 自留地索引指南:

1️⃣ 使用自留地索引 Bot
2️⃣ 使用 sssoou.com 搜索引擎
3️⃣ 使用自留地导航页(博客)

📘 关联阅读:为什么 Telegram 不能搜寻中文讯息

频道:@NewlearnerChannel
#Search #Blog #碎碎念

🔍 如何使用搜索引擎找到技术问题的答案

在说搜索之前,想谈谈如何「提问」,或者换句话说:问题的产生。因为我发现,很多朋友遇到问题时,没有能力去发现、归纳问题所在。譬如 xxx 项目安装失败了,第一反应不是清晰描述、给出截图、附上 log,而是告诉大家:“我安装 xxx 失败了”,等着大家「循循善诱」。前述:论科学提问的重要性

因此在使用搜索引擎之前,我们首先要培养自己发现和归纳问题的一种思维,用简洁而必要的语句和关键词描述出自己的问题。如果能确定一下排查的方向就更好了,但这需要经验的累积

解决了「如何问」的问题,下面就来到了本文的关注点:「怎么查」。作者的观点很明确,提炼出来就是:用英文搜素引擎、提取关键词、掌握专业术语。我认为谷歌是一个兼容并包的平台,收录几乎来者不拒,要流量无竞价广告的运营理念让很多优质的社区和个人博客排名靠前(同时也有 Content Farm)。使用英文关键词搜索,可以帮助你找到 Stackoverflow、GitHub Issues 等高质量答案;中文某些社区确实存在抄袭、机翻等问题,但这并不代表反对用中文搜索

希望大家在阅读完之后能够形成一套产生问题、描述问题、查找问题、解决问题的方法

📘 关联阅读:互联网上常用缩略语集锦

频道:@NewlearnerChannel
#telegram #Search

🔍 为什么 Telegram 不能搜寻中文讯息

⭕️ 圈重点:

- Telegram 使用 SQLite 作为资料库
- fts 全文搜索将字串以 Tokenizer 切割成短语,分别取 Hash,寻找时与哈希表进行比对
- 标记生成器根据分离器、分隔符切割字串
- 分离器、分隔符之外的成分为「令牌」,有“大号*(字母),N *(数字)及Co(其他)”三种预设
- 中日韩文字属于 unicode CJK,绝大多数被识别为令牌

(╯﹏╰) 从而,汉字语汉字间没有任何分隔符,会被整串拿去哈希,于是导致搜寻无效。本文从代码的角度很好地说明了 Telegram 的中文消息搜索为何如此之烂

👨🏻‍💻 作者给了两个建议:

1️⃣ 手动在汉字间插入不可见的分离器
2️⃣ 写个客制化的 Tokenizer,即魔改 Telegram 客户端软件

❤️ 感谢群友分享此文,之前自留地也通过不同的思路整理了中文搜索方案,并认为目前的最优解是通过全局爬虫+数据库索引实现:Telegram 中文搜索方案探索

频道:@NewlearnerChannel
#APPLE #Search #碎碎念

🔎 迹象表明,Apple 即将推出搜索引擎…吗?

近日,Coywolf 的一份报告称:“迹象表明,苹果将推出自己的搜索引擎,和谷歌进行竞争。”文中列举了一些论据,并对此事持乐观态度。我和群友们很感兴趣,也想谈谈自己的看法

👉 迹象:

- CMA 认为苹果设置浏览器默认引擎违反公平竞争的原则
- 苹果在搜索方面投入资金和资源
- 新 Beta 系统中聚焦结果直接指向网站,不通过第三方引擎跳转
- Applebot 文档 7 月更新 SEO 相关内容;爬虫进行活跃的网页爬取工作

🚩 读完后我了解到两个被忽视的事实:一是,苹果有自己的网络爬虫,并为“Siri 建议”和“聚焦建议”提供服务,甚至直接在文档称「Apple Search」大写名词;二是,Beta 可绕过第三方搜索引擎,直接在 Siri 或聚焦中呈现结果(主编测试 iPad 通过)

💡目前苹果已经运用搜索引擎技术于自家系统,因此重点在于:苹果是否会推出独立的搜索引擎和网页服务。我的看法:短期内推出的概率极低甚至为零;长期来看即使因外部环境原因推出,也不符合苹果的一贯做法

苹果一直被视为软硬件好的方案整合商。如果做 Web 搜索引擎, 需跨领域,有大量有经验人员协助开发维护,还要考虑是否开展广告投放、隐私等问题。但苹果并不能在方方面面崭露头角,去年推出的服务没有掀起太大波澜,也没能有效地和领域内的深耕者竞争。使用谷歌引擎和生态已经成了海外大多数人的习惯,想要转变很难。同时,在遭遇反托拉斯的当下,苹果得罪谷歌也不是个明智之举,和则两利

🍎 更重要的是,一个可无障碍访问的 Web 引擎并非苹果一贯风格。其服务根植于生态,或融合于系统、或以 App 存在。收购 Workflow 后将其整合进系统,成为捷径;老牌服务 Apple Music 迟迟推出网页版都体现了这一点。苹果希望用户在其生态范围内使用服务,我也倾向于本次「迹象」只是表明了苹果希望基于系统提供一些搜索服务,而非进一步扩张

🔐 抛开顾虑推测,作为用户我希望苹果推出搜索引擎,带来多种选择。谷歌已经被「内容农场」作得面目全非,不得不靠插件清除。对中文内容的不重视和疏于监管可见一斑。但考虑苹果对于隐私的一贯追求,恐怕很难看到愿望成真

👀 以上是个人观点,大家对于本次事件也会有不同的解读,欢迎进群和我们聊聊~

频道:@NewlearnerChannel
#macOS #App #Search

🌬️ Wooshy · 光速搜索并实现点击

官网文档

我是一个键盘流爱好者,能用键盘做完的事情就不想点鼠标,但很多时候,按钮、跳转链接都必须通过点击完成,有没有一个工具可以实现通过键盘点击呢... Wooshy!

💡 特点

- 模糊搜索 macOS 窗口 UI 的各个元素,根据名称或属性
- 通过键盘快捷键移动搜索目标,VIM 布局键位也可以
- 通过功能键+回车可实现单击、双击、右击等点击姿势
- 可以自定义搜索框的位置和样式

💰 价格

- 当前测试版免费,正式版推出后预计将以 $3.28 提供买断服务

🧰 同类替代工具

- Shortcat (闭源,买断)
- Vimac (开源,免费)
- Homerow (闭源,买断)
- Superkey (闭源,买断)

🐦 使用体验

Wooshy 给我的感觉是「灵巧」,它几乎不需要任何上手成本,快捷键唤出,搜索想要的按钮、链接甚至是窗口左上角的几个小按钮,通过习惯的 tab 键可以选择下一项,回车即点击,鼠标丢一边!

作者现在还在持续开发 Woooshy,未来会添加 OCR,更智能的模糊搜索等功能,令人期待🤤

频道:@NewlearnerChannel
#Web #Newsletter #Search

🔍 竹白专栏检索:快速找到感兴趣的竹白 Newsletters

🔗Web

和国外 Substack、Medium 这样的平台不同,许多国内的 Newsletter 平台一般没有推荐广场,甚至连关键词搜索都没有。这样的好处在于清爽、没有恼人的大数据推荐;但缺点也显而易见,大家无法通过搜索迅速查找并关注自己感兴趣的内容

👀 和 Telegram 的群组和频道一样,很多竹白专栏也需要主理人主动在社交平台发布链接,或由其他人口口相传。自留地和许多竹白专栏主理人有着非常良好的合作,就是希望将这些内容带给大家,做一个更新提醒

💡 如今,有国内开发者带来了这个「竹白专栏检索」网站,截至发文已经收录了 487 份竹白专栏。大家可以根据网站提供的 Tag,亦或是直接搜索关键词,来发掘自己感兴趣的专栏内容并关注

👨🏻‍💻 在网站的侧栏,开发者还统计了「最近更新」「高产作者」「热门专栏」等数据,这对主理人来讲也是一种鞭策。这个网站的出现,为一个个「自留地」铺设了通往广场的路,让游客能够一窥其中风采

📨 如果你喜欢的专栏还没有被收录,或者你本身就是专栏主理人,欢迎想这个网站提交专栏收录

📘 关联阅读:自留地伙伴谈 Newsletter 平台「竹白」使用感受

频道:@NewlearnerChannel
#Search #Tools #Web

Perplexity Ask: 由 AI 和 Bing 加持的搜索引擎

Web

近几个月 ChatGPT 概念大火,微软爸爸也豪掷 10 亿美金投资 OpenAI 并准备将 ChatGPT 植入到 Bing 搜索中。微软的 New Bing 仍在内测,但是早在 2022 年年末就有一款名为 Perplexity Ask 的搜索引擎诞生。根据其官方介绍,Perplexity Ask 使用 Bing 为搜索源并经过 GPT 3.5 处理后将最终搜索结果呈递给用户。

我在去年年末关注到这个搜索引擎,也一直在使用它。Bing 的中文搜索结果一直被人诟病,基于 Bing 的 Perplexity Ask 当然无法解决这个问题。但是如果使用英文进行提问,得到的结果很令我满意。Perplexity Ask 会生成一段完整的话,这段话由拉取搜索结果后加以处理生成,用来回答用户在搜索框内提出的问题。

这就很符合我对搜索引擎的想象。在学校里我们有老师,我们可以向老师提问,老师会综合他自己的知识和经验给予我们回答。虽然我们也可以向搜索引擎提问,但在绝大多数情况下我们得到的信息是破碎的:它们可能分布在多个网页的不起眼的角落,它们也可能会被垃圾信息掩盖。Perplexity Ask 在第一个解决破碎的信息问题上做出了进步,它可以综合信息并输出。对于垃圾信息的问题,Perplexity Ask 可能无法识别那内容农场之类的垃圾信息,但是 Perplexity Ask 给出的回答中都如参考文献一样已经标注好了参考链接,这样使用者可以很方便的去溯源并验证。

Perplexity Ask 似乎没有什么风头,如今几乎已经被 New Bing 盖过。可能如今靠搜索引擎获取信息的人越来越少,尤其是在国内封闭的互联网条件下。但是我还是一直坚持使用搜索引擎,我也非常愿意使用更聪明的搜索引擎。我相信随着 AI 的更深度参与这是一场搜索的革命:搜索引擎会更像一个不知疲惫的老师,只要我们提出问题,它就会耐心地向我们回答问题。

频道:@NewlearnerChannel
#Tools #Search #AI

📩 接读者来稿,他向我们分享了自己申请 Bing ChatGPT 内测资格的全过程

🤖 新 Bing ChatGPT 申请教程

🔗Notion

本文旨在介绍一种低网络要求、避免跳转、完全免费的 Bing ChatGPT 内测资格申请方法,希望大家能够早日用上

📝 文章概述

- 使用说明
- 申请步骤
- 其他事项

👨🏻‍💻 作者的话

新必应 ChatGPT 很火,但还是有人申请不上,或者通过了用不了。其他教程大多需要代理,而本教程不需要

我帮助了身边的朋友,随之整理成一篇图文教程,希望帮助更多感兴趣的人

本教程甚至可以不需要 Edge 浏览器,但需要能够修改请求头的插件,比如 ModHeader(支持 Chromium、FireFox),希望能帮到:

① 不想使用 Edge 浏览器
② 不想长时间代理微软服务的人
③ 你身边那些想尝试又缺少必须网络环境的朋友

频道:@NewlearnerChannel
#Search #AI 

🔍 New Bing:搜索引擎的新纪元 by 𝙈𝙖𝙧𝙫𝙞𝙣 𝘾𝙪𝙞

2月8号申请后,经过几天的等待,昨天早上5:00终于收到了公测资格的邮件。

经过两天的重度测试,我发现这款Bing AI比原ChatGPT在功能上更加完善,也更加智能。如果说ChatGPT是开启AI新纪元的话,那么Bing AI可以称得上是开启了信息搜索的新纪元。

接下来跟大家聊聊我在使用过程中比较满意的地方:

📄 能够标注引用的数据来源

搜索引擎最重要的功能就是信息的聚合与整理,使用了GPT3.5的New Bing在这点上可谓是“如鱼得水”。但原ChatGPT在这方面就有点落后,虽然也可以根据训练的模型对信息进行聚合与整理,但并不能标注出引用的数据来源,这在一定程度上减少了信息的可信度。而New Bing会在输出时标注引用的网站,让生成出的内容可以“溯源”,增加内容的真实性和准确性。

🤩 生成内容更加准确

用过的朋友都应该遇到过,有时ChatGPT会“一本正经的胡说八道”,生成的内容看起来极度连贯,好像没有一点问题,但如果将生成的内容去查询又会发现说的很多都是错误的内容,这种情况会在使用时造成很大的麻烦。而由于Bing AI能够与互联网进行连接,可以从网站提取内容以及对生成的内容进行验证,因此输出的信息大多相对准确。

我使用了一道微积分题目作为验证,将这道题目转换为LateX格式后,把题目分别输入ChatGPT和Bing AI中,ChatGPT从第二步开始犯了一个低级错误,而Bing AI成功算出最终结果。

对于文科相关的内容,例如红楼梦情节相关题目,Bing AI也能很好的进行回答,而在ChatGPT中经常会有瞎编情节的情况出现。

😯输出内容的质量提升

Bing AI相比ChatGPT来说,内容更加完善和全面。例如当提出「如何看待iOS将开放侧载」等问题时,Bing AI可以做到引用各方观点并进行整合,而ChatGPT有时会只输出一方观点,无法做到全面、客观。

🥰 可以连接互联网

虽然前文中有涉及,但还是要单独给这个部分画个重点,这也是最吸引我的内容。

在使用ChatGPT时,里面的模型都是提前训练好的,比较古老的数据,因此对于近期发生的事件并不是很了解;但Bing AI可以在线进行搜索,一个最大的特点就是只要是互联网上的内容,都可以被AI所输出,因此如果您长时间没有换网名的话,Bing AI也大概率可以输出您相关的信息。此外您还可以直接把Web链接扔给Bing AI,让它帮忙进行总结、推断。

除此之外,我就没有发现其他比较大的亮点了。

🤔 但在文章的最后,还要补充一下Bing AI的一个缺点,就是能被Bing AI所引用的网站需要被Bing收录,并且具有一定的权重,这也就意味着Bing AI不会去一些小众的网站获取数据。

总的来说,Bing AI让AIGC的水平和质量有了质的飞跃,也暴露出了Bing想要取代Google的决心。不得不说,Bing AI这个杀手锏,让我这个Google用户也被吸引到了Bing,其实现在Bing的体验也很不错了。

另外,即使你像我一样在使用Arc/Google等浏览器,也可以通过一些插件改变UA来使用Bing AI,频道之前有分享过相关方法

👏 欢迎关注:@MarvinsDaily

频道:@NewlearnerChannel