白交 衡宇 发自 凹尔蒿寺
量子位 | 公众号 QbitAI
又一豪华AI创业团队诞生!
两位来自谷歌DeepMind顶尖科学家,官宣组团构建超级智能自主系统(superintelligent autonomous systems)。
公司名为Reflection AI,先从自主编程下手。
之所以称该团队阵容豪华,是因为2位创始人来头不小:
- Misha Laskin,Gemini核心负责人,是谷歌强化学习和大型语言模型方向的领头人。
- Ioannis Antonoglou,DeepMind的创始工程师之一,是AlphaGo、AlphaZero和MuZero等项目的关键人物。
△图源:Reflection AI
除了两位带头人,Reflection AI官宣的其它创始成员也都来头不小——或出自DeepMind,或出自OpenAI,其中不乏资历很深的朋友。
下图为团队曾经参与的作品:
这或许也是为什么,公司官宣成立即同时宣布了融资进展。
Reflection AI现已筹集了1.3亿美元,最新估值为5.55亿美元(约39.78亿人民币)。
1.3亿美元融资额中,包括2300万美元种子轮融资,由红杉和CRV领投;以及1.05亿美元A轮融资,由光速创投和CRV领投。
(注:光速创投投资过美团、拼多多)
公开消息中的其他投资者,包括LinkedIn联合创始人Reid Hoffman、SV Angel和Nvidia Corp的风险投资部门等等。
(注:SV Angel投资过Facebook、Google、PayPal、Airbnb、Pinterest、Twitter、SnapChat、Notion等)
业内人士纷纷祝贺,表示已经迫不及待地想要看到他们的成果,而他们的「强化学习」血统已经说明了一切。
网友更是发了梗图,似乎已经预见到了之后的路径(Doge)。
比起现有AI助手,“更像Waymo”
为什么去年就成立,且此前一直低调行事的Reflection AI,一下在AI界炸出水花?
或许还是因为与公司官宣同时公布的5.55亿美元高估值。
公司身价至此,Misha有3条解释。
第一,阵容豪华,实力雄厚。
Reflection AI拥有“有史以来最强大的RL和LLM系统背后的团队”,而强化学习和大模型系统,被团队视为超级智能的两个构成本分。
第二,目标明确。
不是做很多事情,而是真正做好一件事——专注于构建世界上最好的自主编程系统。
第三,产研并行。
正所谓,“超级智能不能在真空中构建。”
具体来说,Reflection AI要做的事情,「目标是通过能够自我指导的AI驱动的编程Agent,实现超级智能」。
Misha解释了为什么从自主编程下手。
因为团队相信,解决自主编程问题将更广泛地、更快地实现超级智能。
划重点:
解决自主编程问题。
也就是说,该团队侧重于构建具有完全自主性的工具,而不仅仅是充当一种Copilot或助手。
Misha把典型的AI助手比作巡航定速驾驶(cruise control driving)。
与之相比,Reflection则更像谷歌母公司Alphabet旗下的自动驾驶公司Waymo。
“这是我们十多年来一直在思考的问题。”Misha表示,“我们的团队开创了RL和LLM。现在是时候将这两项进步结合起来,构建一个实用的、可以在计算机上运行的超级智能。”
而公司董事会中的一员、Lightspeed合伙人Raviraj Jain表示,在他看来,Reflection AI的工作并不是为了取代工程师。
更多的是让工程师不再做繁重的工作,而是变得像建筑师一样,工作转化为监督许许多多的自主Agent。
BTW,Lightspeed在3月4号官宣领投了Anthropic的35亿美元融资。
创始成员:一群谷歌&OpenAI前员工
那接下来看看,Reflection AI到底是个怎样的豪华班底。
官方介绍之:他们是来自DeepMind、OpenAI和其他前沿实验室的研究人员和工程师,在过去十年中发挥了主导作用,构建了一些最强大的AI系统。
成果包括DQN、AlphaGo、AlphaZero、MuZero、PaLM、GPT-4、Gemini系列。
没有透露具体姓名,但见其作品已足以顶尖。不过在社交网络上,也是看到了部分团队成员。
两位创始人——Misha Laskin、Ioannis Antonoglou。
Misha Laskin。
此前是Google DeepMind研究科学家,致力于开发通用智能代理,参与了Gemini项目,包括1&1.5,是RLHF、强化学习模型的负责人。
Misha Laskin的谷歌学术论文被引超1万次。
加入谷歌之前,曾在加州大学伯克利分校博士后研究,担任过Claire AI创始人;再往前,他博士毕业于芝加哥大学理论物理学,本科毕业于耶鲁大学。
Ioannis Antonoglou。
2012年,Ioannis Antonoglou就加入了DeepMind。
作为DeepMind创始工程师之一,参与了AlphaGo和AlphaZero项目,亲眼见证了强化学习的胜利。
他硕士毕业于英国爱丁堡大学,博士毕业于伦敦大学学院人工智能方向。
截至目前,Ioannis Antonoglou的谷歌学术被引次数超十万次。
Aakanksha Chowdhery。
她谷歌待了7年,是Palm、Gemini等项目的核心作者。
特别提到一点,她还是PaLM的一作。
在加入现在这个公司前,她曾在Meta待过一段时间,参与了LIama 4多模态预训练的。
Aakanksha硕博毕业于斯坦福,本科在印度理工学院就读。
截至推文发送,她的谷歌学术论文被引次数超25000次。
Richie Steigerwald,硕士毕业于加州州立理工大学。
他是谷歌DeepMInd资深工程师,曾在谷歌待了3年,DeepMind待了7年。
XiaoLan You。
她本科毕业于杜克大学。
XiaoLan You此前曾在亚马逊工作了四年,带领工程师启用新的多层感知器模型,将广告无关性降低55%,并创造了6400万美元的长期利润。
曾端到端开发ML系统,还是首席工程师,负责评估团队开发的所有ML 模型。
Thanard Kurutach。
他本科毕业于MIT,博士毕业于UC伯克利。
加入Reflection AI之前,他曾在Cruise担任高级应用研究科学家,在谷歌大脑担任研究院,主打基于分层视觉模型的强化学习。
Risto Vuorio。
这位小哥去年才从牛津大学怀特森研实验室(WhiRL)博士毕业,研究的重点正是强化学习和模仿学习。此前,他本硕在阿尔托大学就读。
工作经历方面,他曾在高通、Waymo实习。
目前,Reflection AI仍在招人中,包括数据、应用AI技术人员、产品技术人员等等。
旧金山、纽约、巴黎和伦敦等地均有工作室。
One More Big Thing
啊……讲道理,最近两个月,AI界除了技术卷飞以外,融资进展也一个比一个炸裂。
就在3天前,另一则备受业内瞩目的融资消息也被展现在世人眼前:
Ilya自己创业的SSI公司,估值攀升到300亿美元,也就是——2170.47亿人民币。
而且将继续再融资。
这次,这家让外界难以辨清庐山真面目的超级独角兽,有了一点点新消息放出。
据接近此事的人士透露,Ilya表示自己已不再着眼于“原本那个目标”,而是找到了一个“新的目标”。
这个新目标已初现曙光,前景可观。
emmm……听君一席话,如听一席话(狗头保命,溜了溜了)。
参考链接:
[1]https://x.com/MishaLaskin/status/1898048925157728601
[2]https://www.bloomberg.com/news/articles/2025-03-07/ex-deepmind-researchers-new-startup-aims-for-superintelligence
[3]https://x.com/ns123abc/status/1898131208820703474