机器之心报道

机器之心编辑部

今天凌晨,Anthropic 的新旗舰模型如约而至,发布全球首个混合推理模型 Claude 3.7 Sonnet。

在这铺天盖地的宣传中,我们看到了经典 Transformer 论文作者之一 Niki Parmar 的身影,她是 Transformer 唯一女性作者。

从她的推文我们不难发现,Niki Parmar 已经早早加入了 Anthropic,时间大概是去年 12 月。在这期间,Niki Parmar 参与了 Claude 3.7 Sonnet 研发过程,并表示自己能够参与进来很激动。



如果不是宣传自家产品,或许大家都还不知道 Niki Parmar 已经加入 Anthropic 的消息。

不断追求挑战的Niki Parmar



Niki Parmar 是一位来自印度的工程师,硕士毕业于美国南加州大学。曾在印度软件公司工作,后来搬到了美国。

Niki 在求学时,还遇到过小挫折,当时她没能考上印度理工学院 (IIT) ,为此受到了很大的打击。对于许多印度学生来说,IIT 是通往梦想职业的大门。

未能考上印度理工学院的挫折并没有让她放弃。相反,她进入了一家私立工程学院,开始自学人工智能。没有人教她,她只是一头扎进去,边做边学 —— 参加在线课程,做一些业余项目。

毕业后,Niki 前往美国攻读硕士学位。

2015 年 Niki 选择加入谷歌,成为团队中最年轻的成员,也是当时唯一一位没有博士学位的成员。她成功踏入了一个充满 AI 领域最聪明人才的世界。

「一开始确实有点吓人,」Niki 表示。「但这也是一次难忘的学习经历。我身边总是围绕着一群不断突破人工智能极限的人。」

Niki 并不满足于完成分配给她的任务,她开始主动深入研究新兴的 Transformer 模型。没有人告诉她要研究这个,她只是想看看它能走多远。

Niki 的自发努力得到了回报。Niki 将 Transformer 架构应用于不同的模态,包括图像、音频,甚至 3D 视觉,突破了 AI 模型所能实现的极限。

即使在与他人共同撰写了影响深远的 Transformer 论文后,Niki 也不相信自己已经成功了。她的动力来自持续的好奇心。她总是对自己说「总有更多的东西需要学习。我不想只因为 Transformer 模型而被人们记住。我一直在寻找下一个挑战。」

或许是为了追求下一个挑战,Niki 在 2021 年选择离开。她参与构建的 Transformer 模型,成为 ChatGPT 等现代人工智能系统背后的基石。



离开谷歌后,Niki 选择创业,成为 Adept AI 的联合创始人兼首席技术官。

Adept AI 的创始团队非常豪华,联合创始人兼首席执行官 David Luan 曾是 OpenAI 的工程副总裁,深度参与了 GPT-2 和 GPT-3 的开发,后来加入谷歌领导大模型相关工作。联合创始人兼首席科学家 Ashish Vaswani,同样也是 Transformer 架构的提出者之一。不过,令人遗憾的是,这几位大佬都已经离开了 Adept AI。

离开 Adept AI 后,Niki 和 Ashish 又共同创办了大模型初创公司 Essential AI。当时谷歌、英伟达、AMD 等科技巨头都有参与投资。

2024 年 9 月,Niki 离开 Essential AI,并于今年 1 月正式加入 Anthropic,参与到构建 Claude 3.7 Sonnet 的项目上来。



截止到现在,Niki 的论文引用量已经达到 18 + 万次。



在这条推文下,大家纷纷表示祝贺,包括 GoogleDeepMind 研究总监 Dumitru Erhan 等人。



我们也期待 Niki 为 Anthropic 带来更开创性的研究。

参考链接:https://www.ndtv.com/ai/how-niki-parmar-went-from-self-taught-coder-to-modern-ai-pioneer-6706892

ad1 webp
ad2 webp
ad1 webp
ad2 webp