别犹豫,用过才知道 AI 还能这样玩

一直以来,我都比较克制收录依赖 LLM API 的开源项目,总感觉调“API + prompt”没什么新鲜的。但最近老是被它们频繁刷屏,我还是没忍住,实际体验了几款开源 LLM 应用,这些应用安装和配置都很简单。

作者: HelloGithub
分类:实用工具
21 次阅读

一直以来,我都比较克制收录依赖 LLM API 的开源项目,总感觉调“API + prompt”没什么新鲜的。

但最近老是被它们频繁刷屏,我还是没忍住,实际体验了几款开源 LLM 应用,这些应用安装和配置都很简单。

image.png

玩了一圈,我才发现自己之前只用网页对话和 Claude Code 写代码,确实有点落伍了。尤其是在 AI 发展日新月异的今天,我更应该放下对 AI 的偏见,用开放的心态去体验和接受它们。

虽然在我的体验过程中,很少有被 AI 惊艳到或一次跑成功的经历,但这一次我选择拥抱不完美,或许这就是 AI 来时的路。

一、开源的 AI 浏览器:BrowserOSimage.png主语言:C++,Star:7.3k

该项目是基于 Chromium 的开源 AI 浏览器,能够在本地浏览器中运行 AI Agents,可作为 ChatGPT Atlas、Perplexity Comet 和 Dia 的开源替代品。它在保留 Chrome 熟悉界面与扩展兼容性(插件)的同时,实现了 AI 驱动的浏览器自动化与智能问答功能,并支持自定义 LLM 服务或本地大模型。

GitHub 地址→github.com/browseros-ai/BrowserOS

使用感受:BrowserOS 开箱即用,使用起来和 Chrome 基本一模一样,区别就是它集成了 AI 能力,可以让 AI 帮你自动完成操作(不好用)、基于网页的信息回答你的问题(好用,但也取决于用什么模型)。我试了 Agent 和 Teach 模式,均以失败告终😅

e8b9624f84f379a875ab797c00b9ccf8.png

结论:如果你只是想体验一下 AI 浏览器,BrowserOS 使用门槛很低,它不像使用 ChatGPT Atlas 等工具时,需要先解决 OpenAI 账号以及网络等问题。但目前 Agent 自动化操作的体验很差,只有在官方演示的那几个网站才能跑通,比如 GitHub、Amazon。

二、免费跨平台的语音转录工具:Handy4e26b4ca81ffe95409c44bf3bbbd243c.png

主语言:TypeScript、RustStar:6.2k

这是一款基于 Tauri 开发的跨平台语音转文字桌面应用,完全免费开源、本地运行。它界面清爽、交互简单,你只需按下快捷键即可开始转录,并且会将语音转文字的结果,插入到当前文本输入框,体验非常丝滑。

GitHub 地址→github.com/cjpais/Handy

使用感受:虽然语音转文字的工具很多,但 Handy 的简洁给我留下了深刻的印象,无需复杂的配置、功能虽少但十分实用。最新版本还支持自定义 LLM 服务和提示词,还可 AI 后处理转录文本,提高输出的文字质量。但此功能需要通过 ctrl/cmd+shift+d 开启实验模式,才能使用。

342fbc7ef00a6f3907375c09cc833c8f.png

结论:真正完全免费、开源的语音转录工具,核心功能做得很好,并且通过 AI 的加持做到了锦上添花。

三、自动生成每日时间线的 macOS 应用:Dayflow79ec50318f337fbd0b06020d4e31b9b7.png

主语言:SwiftStar:4.4k

这是一款用 Swift 开发的 macOS 应用,通过录制屏幕活动并结合 AI,自动生成每日时间线。它以每秒 1 帧的频率录制屏幕,每 15 分钟利用 AI 分析录像内容,生成简洁的活动总结。同时,支持自动删除超过 3 天的录制文件,节省存储空间。

GitHub 地址→github.com/JerryZLiu/Dayflow

使用感受:确实很轻量,使用起来毫无痛感,它只会安静的运行在你的后台,并且所有数据保留在本地。

6115f3adfc4e7c5c454ff3f4f0943b63.png

结论:Dayflow 样样都好,唯一不足的就是仅支持 Gemini API,且只适用于 macOS 平台。

四、开源的 AI 虚拟伴侣:AIRI9e8449d977644cff34a4f24f3799b19f.png

主语言:Vue、TypeScriptStar:15k

这是一个开源跨平台的 AI 虚拟伴侣,能够将二次元虚拟角色(waifu)等智能体带到你的身边。支持实时文字和语音聊天,可陪你玩 Minecraft、异星工厂等游戏,并提供 Web 端和桌面端应用。

GitHub 地址→github.com/moeru-ai/airi

使用感受:开箱即用但要是想要真正玩起来,除了文本大模型,还需要配置语音、视觉、声音、记忆等服务。

28cf826297db0f347714eb98df2c0ef7.png

结论:懒人无需安装,网页版即可体验。

五、写在最后

在体验这些开源项目的过程中,我发现大多数的 LLM 开源项目,都存在绑定 LLM 服务、无法自定义 LLM API 地址、网络问题和部分功能收费等问题。所以体验一圈下来,我只推荐了上面的 4 个开源项目,虽然他们也都或多或少存在不足之处,但最起码能用,而且只需要自备 LLM API 和 key。

本文由公众号“HelloGihub”授权转载| https://mp.weixin.qq.com/s/sBPlSfEzG5L_3DSielmy6g |(编辑:ZN)