2026年AI劳动力革命:Token配额决定工程师身价
2026-03-24 18:31 loading...
1876年费城世博会,巴西皇帝佩德罗二世第一次听见电话里的声音,惊呼:「天哪,它会说话!」
一百五十年后,2026年3月18日,圣何塞会议中心。黄仁勋站在GTC大会舞台,说出一句更震撼的话:「十年后,NVIDIA大概有7.5万名员工,他们会非常非常忙,因为要和750万个AI agent一起工作。」
台下笑了。7.5万人,750万个agent,1:100。
黄仁勋自己也笑了,补了一句:「它们会全天候工作。希望我们的人不用跟它们比。」

掌声散了,这个数字被更花哨的芯片发布淹没了。但再拎出来想一想,这可能是整场大会最重要的一句话。
算力即生产力:工程师的“第四支柱”薪酬
三个月前,拉斯维加斯CES上,麦肯锡CEO Bob Sternfels说:「我们现在有4万名人类员工,大约2.5万个AI agent。不到两年前,这个数字还是几千。那2.5万个agent过去半年生成了250万张图表。」
过去这活儿是刚入职分析师干的——凌晨三点对齐坐标轴,用最机械的劳动换一张通往合伙人的门票。
如今这张门票的前半段被AI接管了。Sternfels说:AI让某些岗位增长了25%,也让另一些岗位缩减了25%。公司被整整齐齐地劈成两半,扩张的一半和收缩的一半。
NVIDIA的故事和麦肯锡的故事讲的是同一件事:1:100的世界里,干活的是Token驱动的agent,人是连接在agent上面的接口。
外挂的遥控器不在你手里
GTC那一周,黄仁勋做客All-In Podcast,说了一句杀伤力更大的话:「假设你有一个年薪50万美元的工程师。如果他没有消耗至少25万美元的Token,我会非常担忧。」
主持人追问:你们是否在为工程团队花20亿美元买Token?黄仁勋答:「我们正在努力。」
一个不烧Token的工程师,50万也不值50万。

NVIDIA的方案很直接:往薪酬包里塞Token。未来每个工程师都会有一笔年度Token预算,相当于基本工资的一半。
一个拿满额预算的人,等于全天候有十几个AI agent帮他写代码、跑测试、搜文献、做仿真。而只有免费版API额度的人,还在靠双手敲键盘。两个人简历可能一模一样,产出差5到10倍。
今年3月,Business Insider报道:工程师面试时开始问「这个岗位配多少Token预算?」Theory Ventures合伙人Tomasz Tunguz把Token预算称为工程师薪酬的「第四支柱」,排在底薪、奖金、股权之后。
OpenAI总裁Greg Brockman说得更直接:你能调用多少推理算力,将越来越决定你的整体生产力。
黄仁勋在演讲中也承认:「有多少Token跟着我的岗位走?这已经是硅谷的招聘工具了。」
1950年代,底特律工人的生活水准远超手工匠人,不是因为手艺更好,而是脚下踩的是流水线。2026年的Token预算,就是1950年的流水线。
但区别在于:底特律工人离开福特,还能去通用、克莱斯勒,工会能谈判线速。而Token预算不一样——公司给你那天你是超人,收回那天你变回路人。股票能套现带走,技能能跳槽,但Token预算什么都不是,就是外挂,开关在公司手里。
硅谷已出现新词:「GPU饥渴」。顶级研究员跳槽,薪资差距排第二,第一是算力。跑不了实验,部署不了agent,能力被配额卡死。「你们给多少Token」有时甚至排在股票前面。
Goldman Sachs估算,AI可能自动化美国25%的工时。Mercer调查说,65%的高管预期两到三成员工会因AI被重新配置。分界线是Token配额,和人的能力,关系越来越小。
Token吞吐量就是估值
2026年3月初,上海公司MiniMax发布首份年报:全年营收7900万美元,调整后净亏损2.5亿。按传统财务指标看,这是一家烧钱的小公司。
但资本市场不这么看。CEO闫俊杰在财报电话会上说:「公司的价值,由智能密度乘以Token吞吐量决定。」
这不是营收增速,不是用户数,不是毛利率。支撑这句话的数据很硬:2026年2月,MiniMax M2系列模型日均Token消耗量比12月涨了6倍,编程场景涨了10倍。
在开源平台OpenRouter上,MiniMax的M2.5两周消耗4.55万亿Token,首次登顶全球榜首。《南华早报》称:中国的开源模型终结了美国开发者的市场统治。
OpenAI的API每分钟处理60亿Token,两年涨了20倍。年消费超10万美元的企业客户一年翻了近7倍。Barclays分析师罗斯·桑德尔拆解数据后得出结论:OpenAI的消费端Token消耗量是Google Gemini的两倍以上。
Token消耗量,成了给AI公司排座次的硬通货。
纽约时报报道「tokenmaxxing」现象:Meta和OpenAI工程师在内部排行榜上比拼谁消耗的Token多。爱立信斯德哥尔摩办公室的工程师说,他花在Claude上的钱可能比工资还高,但公司买单。
TechCrunch算过一笔账:一个工程师下午写篇文章用掉1万Token,而一个跑agent集群的人,一天可能烧掉几百万。
两年前,每百万Token价格是33美元;现在,9美分。跌了99.7%。价格越便宜,烧得越猛。烧得越猛,越离不开。
闫俊杰预判:未来市场对Token的需求,可能会增长一到两个数量级。
这就是2026年给一家公司定价的新方式。不看你赚了多少钱,看你的Token被烧了多少。MiniMax亏2.5亿,但吞吐量曲线陡得吓人,资本市场愿意下注。这就像2006年的YouTube——一毛钱收入没有,但带宽消耗指数增长,谷歌花16.5亿买下。
当年烧的是带宽,今天烧的是Token。计量单位变了,逻辑没变。
产能等得起,债务等不起
同一周,Stripe发布Machine Payments Protocol:AI agent可以自己花钱了。
一个agent需要数据,自己付费下载;需要算力,按秒购买;调用其他agent API,自动结账。整个过程无需人类确认。Visa适配信用卡支付,Coinbase推出agent专属钱包,Mastercard在开发Agent Pay。

黄仁勋给出对应数字:NVIDIA要把Token生成速率从2200万拉到7亿,350倍。
这是在建一整张公路网,赌车流量会指数增长。
6000亿美元的基建赌注,前提是全球对Token的消耗量能撑起回本。这个前提目前还只是一个昂贵的假设。
2025年最后一个季度,科技公司发行创纪录的1087亿美元债券。2026年初,头几周又是1000亿。
Morgan Stanley和JPMorgan预估未来几年AI相关企业借债总量可能达1.5万亿美元。Goldman Sachs估算,AI资本开支已占美国GDP的3%左右。
华尔街已经开始买保险。信用违约互换交易量上升。几十个基点的保费,赌的是这些公司可能还不上钱。Citi信用策略主管Daniel Sorid说:「面对这种规模的转型,需要这么大资本投入,让人本能地感到不安。」
Google创始人Larry Page曾说:「我宁愿破产也不愿输掉这场竞赛。」
这正是囚徒困境:每一家巨头都在赌对手会继续投入,所以自己不能停。停下来的人直接出局。
乐观的一面有数据:Token生成速率拉高350倍,Stripe让agent自己花钱,麦肯锡两年内从几千个agent扩到2.5万个。如果agent经济全面起飞,消耗量确实可能拐成指数级。
但有一个日期让很多人睡不好觉:2026年下半年,续约悬崖。
2024-2025年,企业花的是「创新预算」。CEO说一句「我们在拥抱AI」,价格不敏感,效果不苛求。2026下半年,第一批试点项目到期。创新预算花完,CTO让位,CFO坐过来。只认一个数字:ROI。
如果大量试点被砍,终端消耗突然出现缺口。上游6000亿砸出的产能,数据中心建好,电力接通,芯片上架,变成闲置。
历史重演:2000年,电信公司花万亿美元铺海底光缆,泡沫破裂,90%光缆暗在海底,闲了近十年。直到流媒体和移动互联网点燃需求,才一根根点亮。建设者大多破产了。
2012年中国光伏,无锡尚德、江西赛维打穿成本线,产能过剩三年,行业血洗。需求后来来了,光伏今天是全球增长最快的能源。但先行者倒在黎明前。
贝尔发明电话,Western Union拒绝以10万美元买专利。十年后愿出2500万,贝尔不卖了。三十年后电话普及,但铺网络的小公司大多没活到那一天。赢家是后来靠收购垄断一切的AT&T。
基础设施的故事永远是这个版本:方向几乎总是对的,但时间差会杀人。
回到Token。前面的结构成立的前提是:消耗持续、大量、加速。工程师的10倍产出靠供给撑着,砍掉就归零。OpenAI的8400亿估值靠承诺撑着,协议终止就缩水。6000亿基建靠终端消耗撑着,增速一放缓就是空转。
每一层依赖下一层。消耗增速若比建设慢两三年,整条链上所有人的定价都会松动。
你靠着哪条铁路
2023年有卡就是爹。2026年有Token就是爹。
听起来像换了个词,但底下变化比大多数人意识到的深。
GPU是资产,买到了就是你的,锁在机房里,别人拿不走。
Token是流量。你的10倍产出、你的高估值、你在谈判桌上的筹码,全部建立在一股持续的、不属于你的供给上。水龙头一关,一切归零。
当Token变成真正干活的劳动力,人就变成了接在Token上面的接口。好的接口能让Token发挥更大价值,判断力、审美、经验还在。但一个接口能做多少事,首先取决于它被接入了多少Token。
1870年代的美国农民发现,种出好小麦还不够,得在铁路边上。1950年代的手工匠人发现,手艺再好也拼不过流水线上的工人。2026年的工程师正在发现,代码写得再漂亮,没有Token预算,一切都是空转。
当Token变成真正的劳动力,人就变成了接口。接口本身的好坏还重要,但接口值多少钱,首先取决于谁在给它供电。
相关阅读
-
2026年AI革命:Token预算成工程师新薪酬支柱区块链资讯 2026-03-24 16:30