白交 衡宇 发自 凹尔蒿寺
量子位 | 公众号 QbitAI

又一豪华AI创业团队诞生!

两位来自谷歌DeepMind顶尖科学家,官宣组团构建超级智能自主系统(superintelligent autonomous systems)。

公司名为Reflection AI,先从自主编程下手

之所以称该团队阵容豪华,是因为2位创始人来头不小:

  • Misha Laskin,Gemini核心负责人,是谷歌强化学习和大型语言模型方向的领头人。
  • Ioannis Antonoglou,DeepMind的创始工程师之一,是AlphaGo、AlphaZero和MuZero等项目的关键人物。



△图源:Reflection AI

除了两位带头人,Reflection AI官宣的其它创始成员也都来头不小——或出自DeepMind,或出自OpenAI,其中不乏资历很深的朋友。

下图为团队曾经参与的作品:



这或许也是为什么,公司官宣成立即同时宣布了融资进展。

Reflection AI现已筹集了1.3亿美元,最新估值为5.55亿美元(约39.78亿人民币)

1.3亿美元融资额中,包括2300万美元种子轮融资,由红杉和CRV领投;以及1.05亿美元A轮融资,由光速创投和CRV领投。

(注:光速创投投资过美团、拼多多)

公开消息中的其他投资者,包括LinkedIn联合创始人Reid Hoffman、SV Angel和Nvidia Corp的风险投资部门等等。

(注:SV Angel投资过Facebook、Google、PayPal、Airbnb、Pinterest、Twitter、SnapChat、Notion等)



业内人士纷纷祝贺,表示已经迫不及待地想要看到他们的成果,而他们的「强化学习」血统已经说明了一切。





网友更是发了梗图,似乎已经预见到了之后的路径(Doge)。



比起现有AI助手,“更像Waymo”

为什么去年就成立,且此前一直低调行事的Reflection AI,一下在AI界炸出水花?

或许还是因为与公司官宣同时公布的5.55亿美元高估值。

公司身价至此,Misha有3条解释。

第一,阵容豪华,实力雄厚

Reflection AI拥有“有史以来最强大的RL和LLM系统背后的团队”,而强化学习和大模型系统,被团队视为超级智能的两个构成本分。

第二,目标明确

不是做很多事情,而是真正做好一件事——专注于构建世界上最好的自主编程系统。

第三,产研并行。

正所谓,“超级智能不能在真空中构建。”



具体来说,Reflection AI要做的事情,「目标是通过能够自我指导的AI驱动的编程Agent,实现超级智能」。

Misha解释了为什么从自主编程下手。

因为团队相信,解决自主编程问题将更广泛地、更快地实现超级智能。



划重点:

解决自主编程问题

也就是说,该团队侧重于构建具有完全自主性的工具,而不仅仅是充当一种Copilot或助手。

Misha把典型的AI助手比作巡航定速驾驶(cruise control driving)。

与之相比,Reflection则更像谷歌母公司Alphabet旗下的自动驾驶公司Waymo



“这是我们十多年来一直在思考的问题。”Misha表示,“我们的团队开创了RL和LLM。现在是时候将这两项进步结合起来,构建一个实用的、可以在计算机上运行的超级智能。”

而公司董事会中的一员、Lightspeed合伙人Raviraj Jain表示,在他看来,Reflection AI的工作并不是为了取代工程师

更多的是让工程师不再做繁重的工作,而是变得像建筑师一样,工作转化为监督许许多多的自主Agent。

BTW,Lightspeed在3月4号官宣领投了Anthropic的35亿美元融资。

创始成员:一群谷歌&OpenAI前员工

那接下来看看,Reflection AI到底是个怎样的豪华班底。

官方介绍之:他们是来自DeepMind、OpenAI和其他前沿实验室的研究人员和工程师,在过去十年中发挥了主导作用,构建了一些最强大的AI系统。

成果包括DQN、AlphaGo、AlphaZero、MuZero、PaLM、GPT-4、Gemini系列。

没有透露具体姓名,但见其作品已足以顶尖。不过在社交网络上,也是看到了部分团队成员。

两位创始人——Misha Laskin、Ioannis Antonoglou

Misha Laskin



此前是Google DeepMind研究科学家,致力于开发通用智能代理,参与了Gemini项目,包括1&1.5,是RLHF、强化学习模型的负责人。

Misha Laskin的谷歌学术论文被引超1万次。

加入谷歌之前,曾在加州大学伯克利分校博士后研究,担任过Claire AI创始人;再往前,他博士毕业于芝加哥大学理论物理学,本科毕业于耶鲁大学。

Ioannis Antonoglou



2012年,Ioannis Antonoglou就加入了DeepMind。

作为DeepMind创始工程师之一,参与了AlphaGo和AlphaZero项目,亲眼见证了强化学习的胜利。

他硕士毕业于英国爱丁堡大学,博士毕业于伦敦大学学院人工智能方向。

截至目前,Ioannis Antonoglou的谷歌学术被引次数超十万次。



Aakanksha Chowdhery

她谷歌待了7年,是Palm、Gemini等项目的核心作者。

特别提到一点,她还是PaLM的一作。

在加入现在这个公司前,她曾在Meta待过一段时间,参与了LIama 4多模态预训练的。



Aakanksha硕博毕业于斯坦福,本科在印度理工学院就读。

截至推文发送,她的谷歌学术论文被引次数超25000次。



Richie Steigerwald,硕士毕业于加州州立理工大学。

他是谷歌DeepMInd资深工程师,曾在谷歌待了3年,DeepMind待了7年。



XiaoLan You

她本科毕业于杜克大学。



XiaoLan You此前曾在亚马逊工作了四年,带领工程师启用新的多层感知器模型,将广告无关性降低55%,并创造了6400万美元的长期利润。

曾端到端开发ML系统,还是首席工程师,负责评估团队开发的所有ML 模型。

Thanard Kurutach

他本科毕业于MIT,博士毕业于UC伯克利。

加入Reflection AI之前,他曾在Cruise担任高级应用研究科学家,在谷歌大脑担任研究院,主打基于分层视觉模型的强化学习。



Risto Vuorio

这位小哥去年才从牛津大学怀特森研实验室(WhiRL)博士毕业,研究的重点正是强化学习和模仿学习。此前,他本硕在阿尔托大学就读。

工作经历方面,他曾在高通、Waymo实习。



目前,Reflection AI仍在招人中,包括数据、应用AI技术人员、产品技术人员等等。

旧金山、纽约、巴黎和伦敦等地均有工作室。



One More Big Thing

啊……讲道理,最近两个月,AI界除了技术卷飞以外,融资进展也一个比一个炸裂。

就在3天前,另一则备受业内瞩目的融资消息也被展现在世人眼前:

Ilya自己创业的SSI公司,估值攀升到300亿美元,也就是——2170.47亿人民币。

而且将继续再融资。



这次,这家让外界难以辨清庐山真面目的超级独角兽,有了一点点新消息放出。

据接近此事的人士透露,Ilya表示自己已不再着眼于“原本那个目标”,而是找到了一个“新的目标”。

这个新目标已初现曙光,前景可观。

emmm……听君一席话,如听一席话(狗头保命,溜了溜了)。

参考链接:
[1]https://x.com/MishaLaskin/status/1898048925157728601
[2]https://www.bloomberg.com/news/articles/2025-03-07/ex-deepmind-researchers-new-startup-aims-for-superintelligence
[3]https://x.com/ns123abc/status/1898131208820703474

ad1 webp
ad2 webp
ad1 webp
ad2 webp