UC伯克利,两个教授撑起半个硅谷AI?
2016年秋天,加州大学伯克利分校的一间实验室里,几个博士生在赶一项课程作业——设计一个分布式计算框架。
九年过去,这项课程作业成了今天OpenAI、Anthropic、字节、Meta训练大模型时底下都在跑的标准工具。
它叫 Ray。
Ray不是伯克利的第一个这样的故事。这所学校有两位教授各撑着一件事——Ion Stoica过去十五年做的是AI底下跑的开源基础设施(Ray只是其中之一);另一位教授带出了半个硅谷AI公司的创始人。
一个教授,三代实验室
Ion Stoica是伯克利计算机系的教授。从2011年开始,他每隔大约五年开一个新实验室,每一代的主题都是"AI的下一代基础设施"。
第一代:AMPLab(2011-2016)
博士生 Matei Zaharia 2009年开始做Spark——今天全世界公司处理数据的底座。2013年,Zaharia和Stoica等人联合创办Databricks。2024年底,Databricks估值620亿美元。
第二代:RISELab(2017-2021)
2016年,几个博士生——Philipp Moritz、Robert Nishihara——把一项课程作业做成了Ray,一个让分布式训练变简单的开源框架。2017年论文发表,2019年他们联合Stoica创办公司Anyscale。今天Ray是OpenAI、Anthropic、字节等公司做大模型分布式训练的主要工具。
第三代:Sky Computing Lab(2021至今)
2023年夏天,Sky Lab的一群博士生——Woosuk Kwon(韩国)、Zhuohan Li(华人)、Lianmin Zheng(华人)等九位——发布了vLLM。这是一个大模型推理引擎,借用操作系统里"虚拟内存分页"的老思路来管理大模型推理时的内存——把推理速度提高2到4倍,显存占用砍掉一大块。今天vLLM是全球用得最广的开源大模型推理引擎之一,GitHub上有2000多位贡献者。
三代实验室、十五年一条主线,每一代都从一群博士生的课程作业/课题出发,最后变成全球开源生态——这种流水线式的AI基础设施产出,在全球任何学校都找不到第二例。
一个教授,带出十几家AI公司
伯克利还有另一个独特的教授——Pieter Abbeel,人工智能与机器人方向。
过去十几年,从他实验室走出去的博士生,创办了十几家AI公司,下面这些名字家长应该不陌生:
OpenAI联合创始人John Schulman——ChatGPT背后的RLHF算法是他主导的
Perplexity创始人Aravind Srinivas——挑战Google搜索的AI问答引擎
Physical IntelligenceChelsea Finn和Sergey Levine联合创办,做机器人通用大模型
Covariant2017年Abbeel本人和三位华人博士生Peter Chen、Rocky Duan、Tianhao Zhang联合创办,做工业机器人AI。2024年8月,Amazon以约4亿美元把这家公司的技术和团队一并收编,Abbeel去Amazon旧金山的高级AI实验室,Peter Chen和Rocky Duan带着他们的机器人AI模型去帮Amazon管理100多万台仓库机器人
还有Skild(Deepak Pathak)、Reflection(Misha Laskin)、Ideogram(Jonathan Ho)、Evolutionary Scale(Roshan Rao)、Genmo(Ajay Jain)……
一个教授门下走出十几家AI公司,估值加起来上千亿美元。这个密度,全球任何大学都极罕见。
AI地基里的华人痕迹
伯克利在AI基础设施的每一层里,都站着一批华人。
vLLM这个全球用得最广的大模型推理引擎,九位核心作者里六位是华人——Zhuohan Li、Lianmin Zheng、Ying Sheng、Siyuan Zhuang、Hao Zhang、Cody Hao Yu。Zhuohan Li 2019-2024在伯克利读博,现在在Meta继续做大模型系统;Hao Zhang是LMSYS团队的核心成员——就是那个做Chatbot Arena大模型竞技场的团队,今天全球所有大模型的排名都看这个榜。
Covariant前面讲过——三位联合创始人全是伯克利的华人博士生。Amazon那笔4亿美元的交易里,这三个人一起被带进了Amazon机器人部门。
IOI选手接力:2013年IOI世界第一、清华姚班毕业的陈立杰,在伯克利做了几年助理教授,2026年春天刚去OpenAI。2016年IOI世界第一的金策2025年7月拿到伯克利的Miller博士后奖学金——伯克利基础科学领域每年只给十几位的荣誉型博士后。
IOI中国队的选手读博时,最常去的就是伯克利、MIT、CMU、斯坦福这四所学校。
公立大学的基因:做出来,给全世界用
伯克利为什么能一代又一代做出开源的底层基础设施?
因为它是公立大学,学术文化和私立名校不一样。
• CS61A("结构与解释计算机程序")是全球最有名的编程入门课,教材、视频、作业、评测系统——全部公开,任何人都能跟着学
• BSD Unix(1970s-90s)源自伯克利,今天macOS、iOS、PlayStation的底层都建在它之上
• Postgres数据库源自伯克利Michael Stonebraker的实验室(Stonebraker后来拿了图灵奖)
• RISC处理器架构——David Patterson(2017年图灵奖得主)在伯克利开创,今天苹果M系列、华为鲲鹏、几乎所有手机芯片都建立在这条路线上
"开源、公立、动手"不是修辞,是这所学校的百年传统。所以它做的是可被全世界用的基础设施,不是关起门的研究成果。
连它的招生口味也是这样——在伯克利的评价里,一个高中生如果给vLLM这类开源项目提过一个被合并的PR,往往比再多几门AP满分更有分量。