很多人说“AI Agent 听着很猛,落地一地鸡毛”。

我把结论摁在这:Agent 不是不行,你缺的是一套能长期跑的“工地化配置”。没有它,所谓 Agent 就是个会说话的 Demo。

这里的“工地化”你可以理解成搭脚手架:把 工具链 / 权限边界 / 日志与自启 这些东西先固定住,让它能自己跑,不靠你点“运行”。

我这段时间在一台 Mac mini 上跑 3 个本地 Agent(OpenClaw):一个写内容,一个盯运维,一个跑定时任务。跑起来之后,你会发现“雷声大雨点小”通常是下面三件事没做到。


你没有让它“自己干活”,只是让它“陪你聊天”

Agent 的核心不是“能回答”,而是“能交付”。

我现在的日常是:

  • 凌晨 3 点:cron 把它叫醒,跑完任务,醒来我直接看结果
  • 白天:我只下指令,不盯过程(该失败就失败,日志要在)

很多人的“Agent 落地”其实是:

  • 你问一句它答一句
  • 你不点“运行”,它就不会跑
  • 你关电脑,它就下班

那当然雨点小。

想验证很简单:给自己定一个硬指标——每天固定时间,它必须给你一个可用产物(一份日报/一段脚本/一张表),不靠你盯。


你没给它“工具链”,只给了它“嘴”

模型再聪明,没有工具也是嘴炮。

我给 Agent 的工具很朴素:

  • 能跑命令:拉日志、查磁盘、看进程
  • 能操作浏览器:把“网页上的按钮”当成 API
  • 能发消息:把结果扔到飞书里

我用的是开源的 OpenClaw(轻量,Mac 上直接装),不用上来就学 K8s。核心原则就一句:少配,能跑就行。

落地卡住的人,常见是两个极端:

  • 权限太小:它想做事,但连文件夹都读不到
  • 权限太大:一把梭,最后你不敢让它跑(怕删库/怕误操作)

我现在更信一条笨办法:用操作系统做隔离,用最小权限做授权

同一台机器上跑多个 Agent,我直接让它们在不同 macOS 用户下运行:

  • 该看什么目录,给什么目录
  • 该用什么 SSH key,就生成什么 key
  • 该读哪个库,就给只读账号

这套东西麻烦归麻烦,但踏实。


你没把“可持续”当成第一目标

Agent 真正的敌人不是“不会写”,是“跑三天就坏”。

我踩过的坑很土,但都是真坑:

  • VPN 一断,所有外部请求一起跪
  • 浏览器登录态丢了,自动化全失效
  • 定时任务跑了,但产物没落盘,你第二天啥也找不到

还有个更离谱的:我一开始用 LaunchAgent 做开机自启,重启后它根本没跑。半夜盯着 launchctl list 一片空白,差点把键盘砸了。后来换成 LaunchDaemon 才稳定。

所以我给自己的标准是:

  • 失败要可定位:日志必须在、输出必须在
  • 重启要能恢复:开机自启、任务可重跑
  • 结果要能积累:每天写工作日志,长期经验单独沉淀

我现在会让它把每天的关键动作写到 memory/YYYY-MM-DD.md 这种流水账里;有用的经验再提炼到长期笔记里。时间一长,Agent 的“进化”是看得见的。


给你一个能起步的方案

别一上来就做“通用助理”,那玩意最容易烂尾。

挑一个你最痛的活,按这个顺序搭:

  • 任务:每天固定时间交付一个产物
  • 工具:命令行/浏览器/消息三选一先打通
  • 权限:最小化授权,能做事但做不坏事
  • 记忆:日志落盘 + 长期经验沉淀(不然永远从 0 开始)

你只要把这四件事跑顺,Agent 立刻从“聊天玩具”变成“打工搭子”。

我不觉得 Agent 会一夜改变世界,但它确实能把很多“人不想干、又必须干”的活吃掉。