在美国 AI 圈,Nathan Lambert 是一个无法绕开的名字。
他曾参与组建了 Hugging Face 的 RLHF 研究团队,后来担任艾伦人工智能研究院(AI2)大模型后训练负责人,深度参与了 OLMo 和 TULU 等开源模型的打造。2025 年 DeepSeek 引爆全球讨论后,他在知名播客 Lex Fridman 中进行了长达 5 小时的对谈,被公认为 AI 社区中受尊敬的研究者与技术传播者。
2026 年 4 月,这位长期站在美国开源模型最前沿的研究者,展开了一场极具深意的**“中国行”**。他走进北京、杭州和上海的 AI 实验室,密集拜访了阿里巴巴、月之暗面(Moonshot)、智谱 AI(Zhipu AI)、美团、小米、蚂蚁集团以及零一万物。
回到美国后,他在科技界引发了不小的讨论。近日,《硅谷 101》在西雅图对他进行了专访,聊了聊他眼中的中美 AI 竞争、中国 AI 的独特性,以及全球大模型竞赛的下一站。
01 初衷与“谦卑”:打破信息的高墙 🧱
Nathan 表示,这次中国行最直接的动力是,作为一个覆盖全球模型的科学观察者,他发现中美科技界之间存在一道厚重的“墙”。在 Meta 或 Google,如果员工前往中国,笔记本电脑甚至会自动锁定,这种隔阂阻碍了跨文化的深度交流。
“人们总问我有什么‘劲爆’的发现。其实在大模型领域,谁在做什么大家大体清楚。我这次去,是为了认识那些模型背后的人,去理解他们为什么而做。” Nathan 特意在文章中使用了“谦和与谦卑(Humility)”这个词。
他发现,很多美国人对中国 AI 的认知完全基于推测,而真正走进清华大学周边的创业集群,看到那些如硅谷般紧密相连的实验室,他意识到,如果不理解中国的教育体系、人才流动和科研本能,就无法真正判断中国 AI 的潜力。
02 独特的中国图景:年轻、实用与“全栈” 🚀
在拜访过程中,有几点发现让这位资深研究员倍感深刻:
-
惊人的“年轻化”人才 👶: 在月之暗面(Moonshot)和零一万物(ZAI),Nathan 见到了大量极其年轻的面孔。他提到一篇名为《Attention Residues》的论文,作者竟包含 17 岁的高中生;而在小米,有的核心模型负责人甚至是还没毕业的博士生。“在美国,虽然也有顶级天才,但中国这种将学术界(如清华)与初创公司紧密缝合、大规模吸收饥渴年轻人才的效率,非常惊人。”
-
实用主义与“技术所有权” 🛠️: Nathan 观察到一个有趣的现象:美团、小米等公司都在投入重金研发自己的大模型。 “在圣克拉拉或旧金山,Uber 或 Apple 的第一反应可能是买个 API。但中国企业的逻辑是:如果有钱、有算力、有人才,为什么不自己造?” 这种对“全栈所有权”的执着,源于中国互联网激烈的竞争环境——只有拥有底层模型,才能拥有更低的成本和更高的产品毛利。
-
“展厅文化”与 AGI 的野心 🏛️: 在他看来,智谱 AI(Zhipu AI)极具 AGI 导向,其展厅甚至标有“AGI 进度 42%”的致敬标志;而 Moonshot(Kimi)则展现出了极高的凝聚力和“极客氛围”。
03 中美差距的真相:6 到 9 个月的“动态静止” ⚖️
关于最受关注的“差距问题”,Nathan 给出了客观的量化观察:
- 基准测试的差距: 目前在传统 Benchmark 上,中国 SOTA 模型落后美国顶级模型约 6 到 9 个月。
- 发布的“快鱼”策略: “中国实验室执行效率极高。有的模型刚跑完一周 RL(强化学习),转头就发布。而美国实验室往往有数周的流程。” 这在某种程度上拉近了用户感知的距离。
- 开源领域的易主: Nathan 坦言:“在 2025 年夏天之后,如果你还觉得美国统治着开源模型,那可能是一种误解。从 Qwen 到 DeepSeek,再到 GLM 和 Kimi,全球开源模型的领导权已在很大程度上向中国倾斜。”
然而,他也指出,美国的优势在于**“不可量化的鲁棒性”**以及在逻辑代码、复杂推理上的“深水区”积淀。
04 核心瓶颈:算力焦虑与数据断层 ⚠️
尽管人才和工程能力卓越,但中国 AI 面临着两大真实挑战:
1. 算力(GPU)的物理墙 🔌 “所有中国实验室都极度渴望英伟达芯片。” Nathan 透露,一名 OpenAI 的研究员可能拥有 5000 块 GPU 的使用权,这可能是一个中国初创公司的全部家当。算力稀缺迫使中国实验室必须追求极端的高效率(如 DeepSeek 在显存优化上的创新),但也封死了在算法上大规模“试错”的空间。
2. 缺失的“专业数据工业” 📊 这是 Nathan 认为最被低估的差距。“在美国,OpenAI 等公司每年的数据预算高达 10 亿美金,背后有 Scale AI 等公司支撑着庞大的高水平人类反馈网络(如雇佣专业医生、程序员产生数据)。” 在中国,这种分工明确的专业数据服务业尚不成熟。大模型公司往往需要自己组建数据团队,这在处理法律、医疗等专业语境的 Agent 开发时,可能会成为隐形的掣肘。
05 写在最后:全球 AI 竞赛的下一站 🏁
面对 Jensen Huang(黄仁勋)关于“禁令无法阻止中国 AI”的讨论,Nathan 认为算力禁令确实推动了中国本土芯片(如华为昇腾)在推理端的应用,但训练端的鸿沟可能还需要数年时间填补。
“未来 12 个月,我会看到更多的 Agent 应用在中国落地。中国开发者对技术的变化已经习惯了,他们不像美国精英阶层那样对 AGI 充满职业焦虑,他们只想把工具造出来。”
通过这次旅程,Nathan Lambert 带回了一种更平面的视角——AI 不仅仅是地缘政治的筹码,更是两群极其聪明、努力的年轻人在不同环境下的同向奔赴。
“我想做的,是让这两群人更有‘人感’地被看见。” 🤝
✨ 关注《硅谷 101》,不错过 AI 最前沿的一线深度内容。