实践

回顾过去三年,在 AI 的协助下完成了不少小而有意思的实践
- 统一设备为 Linux 环境
原生 Win 设备也启用 WSL,软路由换成了 Debian,方便用一套技术栈解决更多的问题; - 用专业开发板解决接收副卡短信的需求
软路由部署自己写的 Web 服务,随时随地远程控制 SIM 卡开关机和查看短信; - 家庭影音自动化工作流
借助开源产品和 NAS,实现远程下载、自动化刮削、自动推送至 Jellyfin; - 家庭网络的灾备策略
最极端情况,软路由下线,主路由也可以快速接管,重新上线后自动恢复原有的网络拓扑; - 部署大量容器和脚本
实现各种零散需求,比如 iSponsorBlockTV 自动连接内网的 Apple TV,跳过油管广告; - 开发各种原子化的小工具
处理图片、文档,参数化生成 3D 打印模型,还封装了一些 API、短链服务等等。
这些实践彼此割裂,所有工具也都是独立运行;无论是操作 Claude Code 写代码还是穿透到内网去查看短信,全都需要我自己来操作。
这就引申出一个疑问:“能不能用一套架构来解决这些问题?”
设想

之前和 Claude Code 高频交互的时候,开玩笑说有老罗的 TNT 就好了,或者说能不能有一个极简的键盘,只有“通过”、“拒绝”、“按住输入语音”三个按键。
这其实还是在谈语音输入的问题。问题的本质是:Claude Code 把写代码这个操作变成了输入命令这个一维的操作。
如果更进一步,能不能让上面提到的所有实践像语音输入一样便捷?
架构

设想一个由三部分组成的统一架构
1. 随身硬件终端
以语音、文字或影像作为输入,统一的控制入口;
2. 网络中转与计算中枢
衔接内外网,承担任务调度与数据处理;
3. 统一的类 Linux 设备
从电脑、路由器、NAS 到内网服务器,甚至也包含 Docker 里运行的 Home Assistant。
在这个架构里,无需打开米家来控制家居设备,也无需自己穿透到内网操作 Web 界面。只需要对统一终端下发命令,剩下的就由 AI 自主规划,调用软硬件完成输出。
未来
这样看来,J.A.R.V.I.S. 也没那么科幻了。
期待第一个在设备之上再抽象一层的产品出现。