AI Agent 雷声大雨点小?我跑了 3 个 7×24 本地 Agent 后的结论
很多人说“AI Agent 听着很猛,落地一地鸡毛”。
我把结论摁在这:Agent 不是不行,你缺的是一套能长期跑的“工地化配置”。没有它,所谓 Agent 就是个会说话的 Demo。
这里的“工地化”你可以理解成搭脚手架:把 工具链 / 权限边界 / 日志与自启 这些东西先固定住,让它能自己跑,不靠你点“运行”。
我这段时间在一台 Mac mini 上跑 3 个本地 Agent(OpenClaw):一个写内容,一个盯运维,一个跑定时任务。跑起来之后,你会发现“雷声大雨点小”通常是下面三件事没做到。
你没有让它“自己干活”,只是让它“陪你聊天”
Agent 的核心不是“能回答”,而是“能交付”。
我现在的日常是:
- 凌晨 3 点:cron 把它叫醒,跑完任务,醒来我直接看结果
- 白天:我只下指令,不盯过程(该失败就失败,日志要在)
很多人的“Agent 落地”其实是:
- 你问一句它答一句
- 你不点“运行”,它就不会跑
- 你关电脑,它就下班
那当然雨点小。
想验证很简单:给自己定一个硬指标——每天固定时间,它必须给你一个可用产物(一份日报/一段脚本/一张表),不靠你盯。
你没给它“工具链”,只给了它“嘴”
模型再聪明,没有工具也是嘴炮。
我给 Agent 的工具很朴素:
- 能跑命令:拉日志、查磁盘、看进程
- 能操作浏览器:把“网页上的按钮”当成 API
- 能发消息:把结果扔到飞书里
我用的是开源的 OpenClaw(轻量,Mac 上直接装),不用上来就学 K8s。核心原则就一句:少配,能跑就行。
落地卡住的人,常见是两个极端:
- 权限太小:它想做事,但连文件夹都读不到
- 权限太大:一把梭,最后你不敢让它跑(怕删库/怕误操作)
我现在更信一条笨办法:用操作系统做隔离,用最小权限做授权。
同一台机器上跑多个 Agent,我直接让它们在不同 macOS 用户下运行:
- 该看什么目录,给什么目录
- 该用什么 SSH key,就生成什么 key
- 该读哪个库,就给只读账号
这套东西麻烦归麻烦,但踏实。
你没把“可持续”当成第一目标
Agent 真正的敌人不是“不会写”,是“跑三天就坏”。
我踩过的坑很土,但都是真坑:
- VPN 一断,所有外部请求一起跪
- 浏览器登录态丢了,自动化全失效
- 定时任务跑了,但产物没落盘,你第二天啥也找不到
还有个更离谱的:我一开始用 LaunchAgent 做开机自启,重启后它根本没跑。半夜盯着 launchctl list 一片空白,差点把键盘砸了。后来换成 LaunchDaemon 才稳定。
所以我给自己的标准是:
- 失败要可定位:日志必须在、输出必须在
- 重启要能恢复:开机自启、任务可重跑
- 结果要能积累:每天写工作日志,长期经验单独沉淀
我现在会让它把每天的关键动作写到 memory/YYYY-MM-DD.md 这种流水账里;有用的经验再提炼到长期笔记里。时间一长,Agent 的“进化”是看得见的。
给你一个能起步的方案
别一上来就做“通用助理”,那玩意最容易烂尾。
挑一个你最痛的活,按这个顺序搭:
- 任务:每天固定时间交付一个产物
- 工具:命令行/浏览器/消息三选一先打通
- 权限:最小化授权,能做事但做不坏事
- 记忆:日志落盘 + 长期经验沉淀(不然永远从 0 开始)
你只要把这四件事跑顺,Agent 立刻从“聊天玩具”变成“打工搭子”。
我不觉得 Agent 会一夜改变世界,但它确实能把很多“人不想干、又必须干”的活吃掉。