马斯克说2026年底AI直接写二进制?说个每天用AI写代码的人的真实体感

马斯克说的二进制那事儿就不展开了,上面已经有人从 Transformer 架构和 ELF 文件格式的角度把这条路堵死了。我想从另一个角度聊——作为一个每天都在用 AI 写生产代码的人,”编程全面自动化”到底差多远。

先交代背景:我写了十几年 Java/后端,去年开始用 Claude Code + Codex 做项目。到现在上线了好几个——开源通知网关 Orion、agentskill.work 目录站、一套博客自动化工具链。这些项目里 AI 写了绝大多数代码,我写的是架构规范和验收标准。

所以我说的不是理论推测,是干出来的东西。


一个让我彻底清醒的经历

说个具体的事。agentskill.work 上线第一天,流量比预期大了 3 倍。Nginx 开始 502。

AI 帮我写了全部代码——FastAPI 后端、GitHub API 抓取、Celery 定时任务、Docker Compose 编排、Umami 埋点。从想法到部署,半天。速度确实离谱。

但 502 的时候 AI 帮不了你。

我排查了 20 分钟,发现 Gunicorn worker 数量设的太少。改成 workers = 4 解决了。这个数字哪来的? 2 * CPU核心数 + 1 是教科书公式,但我的 VPS 是 2核4G,跑着 Postgres + Redis + Celery,实际留给 Gunicorn 的资源没那么多。4 个 worker 是我试出来的——先开 5 个,RSS 上到 3.2G 开始 swap,降到 4 个稳定在 2.8G。

这种判断 AI 做不了。它不知道你那台机器上还跑着什么,不知道 swap 一旦触发延迟会从 2ms 飙到 200ms,不知道你的用户对延迟的容忍度是多少。

这才是”编程自动化”真正卡住的地方——不是写代码,是做决策。


AI 编程的真实水位线

我来说说我每天实际干的事,给个直观的画面。

早上开电脑,git status 看昨天状态。打开 tasks.md 确定今天做什么。给 Claude Code 一段需求描述,它刷刷写出来。我 git diff 看改动,确认没越界,提交。再下一个任务。

听着像流水线对吧?效率确实高。以前一周的活,现在两天能做完。

但魔鬼在细节里。

做 Orion 的时候——统一通知网关,后端 FastAPI + SQLAlchemy,前端 Next.js——项目到了大约 15000 行代码的时候,AI 开始”忘事”。改了消息模型的字段,忘了 Alembic migration。加了新的通知渠道,忘了更新 API 文档。写了重试逻辑,但退避策略是固定 3 秒而不是指数退避——上线到生产环境会把下游服务打爆。

我后来搞了一套机制来兜底:

# AGENTS.md 里强制规定的提交检查清单
# 改了 models/ 目录 → 必须有对应的 alembic revision
# 改了 api/ 目录 → 必须更新 docs/api.md
# 新增通知渠道 → 必须有 adapters/ 下的适配器 + tests/

CI 里写了个 shell 脚本检查这些:

# check_agents_chat.sh — 核心目录改动必须有协作日志
CHANGED_DIRS=$(git diff --name-only HEAD~1 | grep -E '^(backend/core|backend/api|frontend/app)')
if [ -n "$CHANGED_DIRS" ]; then
    CHAT_LOG=$(git diff --name-only HEAD~1 | grep '^agents_chat/')
    if [ -z "$CHAT_LOG" ]; then
        echo "❌ 核心目录有改动但没有 agents_chat 日志"
        exit 1
    fi
fi

这段代码本身也是 AI 写的。但”需要这么一个检查”这个想法,是我被咬了三次之后才悟出来的。


我理解错了什么

去年刚开始用 AI 编程的时候,我以为瓶颈在”提示词写得好不好”。花了一周研究怎么写更好的 prompt。

后来发现完全搞反了。

瓶颈在验收。

AI 生成代码的速度是人的 10 倍,但验证代码正确性的速度一点没变。你还是得 curl 接口看返回值,还是得开浏览器点一遍流程,还是得看日志有没有异常。

而且 AI 会非常自信地告诉你”应该可以了”。这句话我信了前三次,之后再也不信了。

有一次让 AI 写飞书消息推送的适配器,它告诉我”已经实现并测试通过”。我 curl 一下,发现签名算法用了 SHA1 而不是 SHA256——飞书两年前就弃用 SHA1 了。AI 的训练数据里有两个版本的文档,它选了旧的那个。

从那以后我的规矩是:AI 说”应该可以”不算。给我 curl 命令、给我响应截图、给我日志。能验证才算完。

这条规矩直接写进了项目的 AGENTS.md:

## 验收规范
1. 后端接口:附 curl 命令和预期响应
2. 前端页面:附截图或录屏
3. 数据库变更:附 migration 命令和验证 SQL
4. 部署配置:附 docker compose ps 截图

马斯克的预言到底哪里说对了

说了这么多 AI 的问题,但公平讲,马斯克说的那个方向没错。

我用 AI 写代码一年了,有一个体感非常强烈:写代码这件事的成本确实在趋近于零。

agentskill.work,从零到上线,半天。Orion 的 MVP,三天。以前这种项目至少两周起步。

但”写代码”成本归零,不等于”做软件”成本归零。

拿 Orion 举例。AI 三天写出 MVP,但之后我花了三周做这些事:

  • 幂等键设计(消息重复投递怎么处理)
  • 重试退避策略(从固定 3s 改成指数退避,最大 5 分钟,加抖动)
  • 死信队列(重试 5 次还失败的消息往哪放)
  • 限流(上游不能把我打死,我也不能把下游打死)
  • 投递状态追踪(每条消息从接收到投递的完整生命周期)

这些东西 AI 能写吗?能。但前提是我告诉它要写。如果我不提,它绝对不会主动加幂等键。它不知道你的上游系统会在网络抖动时重发消息,不知道飞书 API 在高并发下会随机返回 429,不知道你的 Postgres 在 connection pool 耗尽时会给你一个误导性的 OperationalError 而不是直观的”连接数满了”。

这些知识来自哪?来自被线上事故教训过。Postgres connection pool 那个坑我是 2019 年在一个金融项目上踩的,凌晨三点被叫起来修的,至今记得当时盯着监控面板一脸懵逼的样子。


关于”编程全面自动化”的几个反直觉结论

用了一年 AI 编程,我有几个和主流叙事不太一样的看法:

1. AI 编程越好用,对程序员的要求越高,不是越低。

听着反常识,但道理很简单。AI 把实现成本打下来了,瓶颈就转移到了架构设计和故障排查。以前你写不出来代码,最差也就是进度慢。现在 AI 帮你写了一堆代码,你看不懂也不知道哪里有坑——那才是真正危险的。

我见过有人让 AI 生成了一整个 Node.js 后端,跑着没问题。上线一周,数据库连接泄漏,每隔 6 小时 OOM 重启一次。排查发现 AI 在 async 函数里没正确释放连接——这种 bug 你不懂 Node.js 的事件循环机制,根本找不到。

2. “不再需要编程”这个说法颠倒了因果。

准确地说是”不再需要用编程语言编程”。你还是在编程,只是用自然语言。但自然语言的精度比编程语言差太多了。”做一个用户注册功能”——密码要不要加盐?用 bcrypt 还是 argon2?session 过期时间多长?要不要做邮箱验证?要不要限制注册频率?

这些问题你用编程语言写的时候,语言本身会逼你回答。你不 import bcrypt 就没法加密,你不设 session timeout 就是永不过期。但你用自然语言跟 AI 说”做个注册功能”,这些细节全被吞掉了。

所以”自然语言编程”不是简化了编程,是把显式的复杂度变成了隐式的。该做的决策一个没少,只是藏起来了。

3. 真正被取代的不是程序员,是软件公司。

一个人 + AI 能干以前一个 5 人团队的活。但”这个人”需要的能力不是变少了,是变多了——他得懂架构、懂产品、懂运维、懂安全,还得会审代码。

以前你可以说”我只会写 Java,其他不管”。现在不行了。AI 把所有”我只会 X”的人都变成了多余的。但那些本来就什么都会一点的”全栈选手”,生产力直接翻五倍。

马斯克说到 2026 年底不再需要编程,我的版本是:到 2026 年底,不再需要”只会写代码”的程序员。会做系统设计、能带 AI 干活的人,反而更值钱了。


那到底应该怎么办

如果你是在校学生:代码基本功还是要练的。不是为了以后手写代码,是为了看得懂 AI 写的代码。你得知道什么是对的,才能审出什么是错的。但确实没必要再花几百小时刷 LeetCode 了——把时间花在系统设计、分布式基础、网络协议这些上面。

如果你是工作几年的工程师:赶紧用起来。不是”了解一下”,是每天用。选一个你日常工作中的痛点,让 AI 帮你自动化。你会在第一个项目里就摸清 AI 的能力边界——然后你就知道自己的价值在哪了。

如果你是技术管理者:考虑调整团队结构。以前 1 个架构师 + 9 个开发,以后可能是 3 个架构师 + 3 个 AI 工具操作员 + 0 个纯代码搬运工。


我是老拐,写了十几年后端,现在每天和 AI 搭档干活。上面说的这些全是自己趟出来的,不保证正确,但保证真实。

想看更多 AI 编程的实战经验,可以关注我的博客 yfge.github.io,或者直接看我的 GitHub(yfge)——项目本身和 agents_chat 里的协作记录都是开放的。