Blog
AI & Machine Learning·17 min read

构建取代你的机器

我构建自动化知识工作的AI系统。我也在找工作。这是我从机器内部看到的

Jo Vinkenroye·February 5, 2026
构建取代你的机器

上周二,我构建了一个AI代理,它处理我过去收费150美元/小时的任务。然后我打开LinkedIn继续找工作

2026年1月:108,435人被裁员,5,306个新职位

2026年1月:美国裁员108,435人。计划新招聘约5,306人。比例为1:20。自2009年以来最糟糕的1月

2009年,工作岗位回来了。这次不会

取代工人的不是经济衰退。而是一种永久性能力。AI现在在大多数白领知识工作中表现超越人类:编程、写作、分析、研究、法律审查、医疗诊断

OpenAI和宾夕法尼亚大学2023年3月的研究发现,80%的美国工人至少有10%的任务暴露于大语言模型。

麦肯锡估计,美国30-50%的知识工作可以自动化:未来十年内有4000万至5000万个工作岗位面临风险

为什么"向价值链上游移动"这次不起作用

过去的每一次颠覆都伴随着安慰:被替代的工人向价值链上游移动。工厂工人成为机器操作员。打字员成为数据录入员

这有效是因为机器需要人类监督。管理者、协调员、质量控制员:出现了整整一层工作来监督自动化

AI不需要那一层

它审查自己的输出。它在系统之间协调。它管理质量。

Cognition Labs在2024年3月推出Devin时,它展示了一个AI可以在没有人类干预的情况下计划、执行、调试和迭代复杂的工程任务——数千个决策的深度。它在SWE-bench上得分13.86%,而之前的最先进水平是1.96%。好了七倍

"学会管理AI"是新的"学会编程"。但只需要那么多AI管理者。

而且AI在管理自己方面越来越出色:Anthropic的计算机使用研究展示了Claude自主导航界面、点击、输入、实时适应。OpenAI的Operator更进一步:一个拥有自己浏览器的代理,完成跨网站的多步骤工作流程

监督工作也是可以自动化的

我编写使AI自主的代码

大多数关于AI替代的评论来自从外部进行理论化的记者和经济学家。我编写使AI代理自主的代码。我设计让它们推理、行动和自我纠正的管道

我在自己的服务器上运行一个自托管的AI助手。它管理我的工作流程,监控我的项目,并在需要注意时主动联系

外部认知:AI自动化笨拙、不可靠、需要持续照看。18个月前确实如此。现在不是了

AI今天处理的内容:

  • 接受模糊的需求并生成可工作、经过测试的代码
  • 跨多个抽象层调试复杂系统
  • 学习偏好并主动应用
  • 处理歧义比许多中级开发人员更好

我有13年以上的经验,深度参与AI工具。就业市场仍然艰难。对于没有跟上的开发人员来说,情况更糟

Claude Opus 4.6本周发布,具有100万token上下文

这不是预测。我描述的能力本周就发布了

今天——当我发布这篇文章时——Anthropic发布了Claude Opus 4.6,具有100万token的上下文窗口。这大约是3000页文本同时保存在工作内存中。

整个代码库。整个法律发现。整个季度的财务报告,一次性分析

但上下文窗口大小是最不有趣的部分

持续的自主工作。 据Anthropic称,Opus 4.6在一天内自主关闭了13个GitHub问题,并将12个分配给正确的团队成员,管理跨6个仓库的50人组织。它处理产品和组织决策。它知道何时升级给人类。这不是自动完成。这是项目经理

多步骤代理规划。 该模型将复杂任务分解为子任务,并行运行工具和子代理,识别阻碍,在学习时调整策略。一位早期测试者报告说,它处理了数百万行的代码库迁移"像高级工程师一样":提前规划、适应、用一半时间完成

自我改进。 Opus 4.5展示了自主完善自己能力的代理,在4次迭代中达到峰值性能,而其他模型在10次后无法匹配该质量。它们从经验中学习,存储洞察,稍后应用

Claude Opus 4于2025年中期推出,成为世界上最好的编码模型,在SWE-bench上得分72.5%,并在复杂任务上持续工作数小时。

几个月后,据该公司称,Opus 4.5在Anthropic的内部工程技术家庭作业考试中超越了所有人类候选人。

现在Opus 4.6领先所有主要基准测试:代理编码、财务分析、法律推理、网络安全——通常领先幅度很大

每一代都变得更聪明。每一代都变得更便宜。Opus 4.5降至每百万输入token 5美元。六个月前成本高昂的能力,现在任何拥有API密钥的人都可以使用

从自动完成到同事的三年

2023年: AI作为工具。你输入提示,得到文本。精美的自动完成

2024-2025年: AI作为助手。Anthropic在2024年10月推出计算机使用——Claude可以看到屏幕、移动光标、点击按钮、输入文本。Google在12月宣布Project Mariner。OpenAI在2025年1月推出Operator。笨拙。令人印象深刻的演示。研究预览

2025-2026年: AI作为员工。Anthropic推出Cowork——Claude在你的实际计算机上自主操作,阅读和编辑你的文件,浏览网页,创建文档和电子表格。你不是提示它然后等待。你分配工作然后离开。它在需要时让你参与,就像远程同事一样。这些不再是演示

2026年: AI作为劳动力。OpenAI刚刚推出了Frontier,一个企业平台——仔细阅读——"雇用AI同事,他们承担人们已经在计算机上做的许多任务"

不是工具。不是助手。同事。 这是OpenAI的词

Frontier为每个AI同事提供自己的身份、权限和边界。它用公司背景入职他们。它教他们机构知识。它让他们从反馈中学习。

这是AI的HR入职流程

早期企业客户报告说,一家大型制造商将生产优化从六周缩短到一天。一家全球投资公司为销售人员腾出了90%的时间。一家大型能源生产商将产量提高了5%——超过10亿美元的额外收入

AI作为组织结构图上的员工编制行

AI每年成本为5-12千美元 vs 人类8-12万美元

人类员工与AI代理之间的成本比较
人类员工与AI代理之间的成本比较

人类员工:

  • 年度成本:80,000-120,000美元(工资、福利、管理费用)
  • 工作时间:2,000小时/年(每周40小时)
  • 休假:带薪休假、病假、节假日
  • 规模扩展:线性招聘时间,需要培训
  • 改进:渐进的技能发展

AI代理:

  • 年度成本:5,000-12,000美元(计算+基础设施)
  • 工作时间:8,760小时/年(24/7可用性)
  • 休假:无
  • 规模扩展:即时部署额外代理
  • 改进:季度模型更新,一致的质量

Claude Opus 4.6每百万输入token成本5美元,每百万输出token成本25美元。处理数千步骤的重度自主会话可能花费2-5美元。连续运行8小时"工作日"花费20-50美元。

这是每年5,000-12,000美元的代理,它24/7工作,从不休带薪假,每季度改进

即使是该估算的10倍用于基础设施、编排和错误处理——仍然是人类员工的一小部分。与人类不同,AI代理线性扩展。需要十个?启动十个。在高峰期需要一百个?完成

Anthropic的Cowork现在处于研究预览阶段。OpenAI的Operator集成在ChatGPT中。每个主要实验室都在竞相推出处理完整工作流程的自主代理

问题不是AI是否能做你的办公室工作。而是成本曲线何时跨越你的雇主无法证明不切换的门槛

5年"乐观"时间表已经到来

构建这些系统的AI研究人员看到了这一点。他们的"最坏情况"时间表已经落后于我们

Geoffrey Hinton——图灵奖得主,"深度学习教父"——于2023年5月离开Google,专门警告AI风险,没有企业限制。

在2023年,他认为我们"可能有5到20年"时间,直到AI匹配人类通用智能。我们已经三年了。5年"乐观"情景已经在这里。AI正在自主管理工程团队

尤瓦尔·赫拉利警告即将到来的"无用阶层":人们不仅失业,而且在经济和政治上无关紧要。永久性结构排斥。

在2017年,这感觉像是2040年的问题。在2026年,OpenAI实际上在向企业营销"AI同事"。我们提前14年到达

Erik Brynjolfsson和Andrew McAfee最早看到了这一点。在《与机器赛跑》(2011)和《第二次机器时代》(2014)中,他们记录了数字技术如何使生产力与就业脱钩。

他们对认知自动化的时间表?"未来十年或二十年。"我们在不到十年内就达到了

这场自动化浪潮打破了历史模式:高收入工作面临更大的暴露。以前的每一次自动化浪潮首先打击了底层。这次从顶部开始

织布机取代了织工的手。拖拉机取代了农民的背。计算机取代了职员的算术。每次,人类都转向需要判断、创造力、社交智能的工作——机器无法触及的东西

这是第一波针对思维本身的浪潮

20-30%的失业率使社会激进化

阿拉伯之春在25%的青年失业率时爆发。魏玛德国在1933年之前达到20-30%

如果预计自动化的一半实现——十年内2000万美国工人流离失所——我们正在接近这些阈值

与过去的流离失所不同,这些不会是特定地区的工厂工人。他们将是律师、会计师、开发人员、作家。每个城市的受过教育的人,他们做了一切"正确"的事。上了大学。建立了职业生涯。学习了"正确"的技能

那个人口统计,在那个规模上,不会安静地坐着

UBI解决了收入但不是目的

硅谷的默认答案是全民基本收入。付钱给人们。问题解决了

接受无条件收入而不工作的人报告说动力较低、满意度较低、目的感较少

工作提供的不仅仅是金钱。 结构。社交联系。身份。消除收入焦虑并不能取代这些

什么取代了失去的目的,而不是失去的收入

问题不是如何取代失去的收入。而是如何取代失去的目的

一种可能性:基于信用的系统,认可非经济价值。护理。社区建设。指导。创意工作。环境管理。重要但从未被经济评估的活动

也许后AI经济不是"每个人都得到支票"。也许是建立重视市场无法重视的东西的系统

投机性的。也许天真。仍然比"只是适应"更有趣——适应什么,确切地说?

值得采取的三个对冲

我在对冲

更深入AI。 如果浪潮无论如何都要来,最好是构建它而不是淹没在其中。从内部理解这些系统——它们的架构、它们的失败模式——争取时间

专注于AI不能做的事。 在前所未有的领域进行新颖的系统设计。在信息不完整的情况下做出判断,错误是灾难性的。这些是萎缩的岛屿。仍然是岛屿

接受无常。 我认识13年的职业可能不会以目前的形式再存在13年。不是失败主义。是有用行动的起点


每天早上我使用的AI工具都比上个月更好。在Claude Opus 4和Opus 4.6之间的八个月里,我们从"令人印象深刻的编码助手"变成了"自主管理50人组织的GitHub"

我擅长我所做的事。我可以从机器内部看到,"擅长它"现在有了保质期

导航这一切的人不会否认它,也不会等待别人解决它。他们将是在技术上和社会上理解这一点的人,并开始构建接下来会发生什么

我构建AI系统,正在寻找我在AI/Web3领域的下一个角色。在做重要的事情吗?让我们谈谈

Stay Updated

Get notified about new posts on automation, productivity tips, indie hacking, and web3.

No spam, ever. Unsubscribe anytime.

Comments

Related Posts