宋飏:16岁连云港理科状元上清华,25岁突破AI生图模型,29岁被Meta天价薪资挖走
AI人物 | 感受他们为世界做出的贡献
你刷到过那些AI生成的视频吗?打几个字进去,几秒钟就给你出一段画面,逼真得让人分不清真假。
它们用的方法叫扩散模型。今天能生成视频和图像的AI,绝大多数都用这套方法。国内的即梦、可灵,国外的Sora、Stable Diffusion、DALL·E 2,都是。
扩散模型不是某家公司的发明,背后是几篇关键论文。其中一篇的作者,是个江苏连云港人,叫宋飏。
他写这篇论文那年25岁,斯坦福博士读到第四年。
江苏连云港,新海高级中学
高中三年,宋飏在新海高级中学拿了两个一等奖:全国中学生物理奥赛一等奖、全国青少年信息学奥赛(NOIP)一等奖。
他参加了清华"新百年领军计划"的面试。这是清华的特殊招生项目。17位评委全票通过。
次年高考,江苏卷满分480分,他裸分425分,连云港市理科状元。
16岁,他上了清华。
清华数理基础科学班
宋飏选的不是姚班,是数理基础科学班。
两个都是清华的特殊培养班。姚班偏计算机科学;数理基础科学班数学加物理双修,培养的是基础学科的研究人才。
本科他没走基础学科的路。2016年清华毕业,去斯坦福读AI方向的博士。
斯坦福:从超越GAN到统一扩散模型
博士期间他没碰当时主流的GAN,走的是一条冷门路线:score-based generative model(基于分数的生成模型)。
GAN的思路是"对抗"。一个网络画图,另一个网络挑刺,互相博弈到画得足够逼真。这套思路2014年发表之后,统治了图像生成领域整整5年。
宋飏走的是另一条路。他不让AI直接画图,而是教AI学一件事:拿到一张乱糟糟的噪声图,怎么把它往清晰方向修一步。学会这一步之后,从纯噪声开始反复修几百步,就能修出一张完整的图。
这种"反复修"的思路,就是后来的扩散模型。
2019年,他在NeurIPS(AI领域最顶级的会议之一)发表了第一篇基于分数的生成模型论文。这是基于分数的方法第一次在画图质量上把GAN比下去。
2020年底,他和导师Stefano Ermon等人合作,又发了一篇集大成的论文:Score-Based Generative Modeling through Stochastic Differential Equations。这篇论文用随机微分方程,把当时所有score-based方法和扩散模型装进了同一个数学框架。
这篇论文拿下了ICLR 2021杰出论文奖。
后来主流的图像和视频生成模型,几乎都建立在这套数学框架上。
OpenAI与一致性模型
2022年博士毕业,宋飏加入OpenAI,组建了一个小团队叫"战略探索"。
2023年4月,团队开源了一项新技术:Consistency Models(一致性模型)。一起署名的还有清华校友路橙和OpenAI联合创始人Ilya Sutskever。
扩散模型的痛点是慢。生成一张高清图要反复"修"几十到上百步。一致性模型把这个过程压缩到一两步出图,速度快了几十倍,质量基本不掉。
提出一致性模型的正是他自己。当年扩散模型,也是他奠基的。
那年宋飏27岁。
2025年9月,Meta挖人
2025年9月25日,Meta把他从OpenAI挖走了。
在Meta,他担任超级智能实验室(Meta Superintelligence Labs)的研究负责人(Research Principal),直接向首席科学家赵晟佳汇报。两人都是清华校友。
超级智能实验室是扎克伯格2025年新成立的AI部门,专门用来追赶OpenAI。这一年Meta从OpenAI、DeepMind、Anthropic挖走了一批顶级研究员,宋飏是其中分量最重的几个之一。
Meta这一年挖角的价码刷新了硅谷天花板。OpenAI创始人Sam Altman公开抱怨过,Meta给他的员工开出过1亿美元的签约奖金。