新智元报道

编辑:定慧 好困

【新智元导读】Grok连夜上线图片编辑功能,继Gemini引爆图片编辑热潮后,动动嘴就能实现「证件照换西装」、「黑发变金发」等专业级P图效果。随着AI巨头内卷加剧,很多工作可能会经历「从复杂操作到简单交互」的范式转移,大模型内卷,受伤可能是传统软件。

Grok连夜上线图片编辑功能。

昨晚,Grok上线图片编辑功能,可以通过文字描述直接修改图片。


比如你可以上传一张个人证件照,「动动嘴」让Grok给你PS一套全新的西服。


看起来效果非常不错,Grok还「体贴地」给你设计了四种不同风格,比如领带「带花纹」和「不带花纹」。

不过该功能目前应该还是在灰度测试中(作为Premium氪金用户的Grok主页暂时还没有编辑按钮)。


Grok手机APP同步上线

Grok也同步上线了X的手机APP, 你也可以在手机上体验图片编辑功能。

比如上传一张照片,让图片中人物的「黑发」变成「金发」。


不过作为手机内部的Grok功能,目前同样是在灰度测试中。


由于Grok灰色测试,目前全网还没有太多讨论。

不过从一些博主的测试作品来看,Grok应该是对自己的效果很有信心。

比如这位有6万粉丝的Borriss博主,他的头像是一件「黑色高领毛衣」。


但是经过Grok的P图后,换成了一套「西服」。


「黑毛衣秒变西服」,AI编辑的能力目前看起来效果并不赖。

其他陆续有用户放出了自己使用Grok编辑图片的效果,不过这次Grok犯了一个错误,把用户的脸也给换了。


比如,可以将图片风格变成Egon Shiele的画作风格。


或者是给马斯克加一顶帽子。


大模型「内卷」,PS受伤

Grok这次「连夜」上传图片编辑功能,大概率是被Google的Gemini2.0火出圈的「动动嘴」PS功能给刺激到了。

Google发布Gemini-2.0-flash的Experimantal版本靠着简单的文本描述就能「P图」的能力着实火了一把。

比如将两张照片P在一起还不违和,并且可以添加人物动作。


或者,将白色风格的裙子换成红色,还能给人物打个领带。


从Gemin2.0到Grok的图片编辑,能看出目前SOTA模型的「内卷」依然还在进行。

大模型也在「抢占」用户心智。

以后人们谈起P图,第一个想到也许不是Photoshop这种传统的图片编辑软件,而是AI赋能各种大模型功能。

从P图这件事情可以窥见一些苗头,AI的发展很可能会带来一个很大的「范式转移」。

未来的很多工作会从「复杂操作」变成「简单交互」。

比如在图片编辑领域,Gemini和Grok等大模型将持续降低图片编辑的技术门槛。

从原来需要专业软件、复杂步骤,到只需一句自然语言指令即可实现高质量图片编辑。

当然在目前的大模型P图效果依然停留在「可玩」的层面,专业的图片编辑还需要专业的UI工程师使用特定的软件才能完成。

不过SOTA模型的内卷依然没有结束。

正如Alvaro Cintas所说,为什么OpenAI还没有发布原生图像生成和编辑功能。


也许快了,说不定哪天ChatGPT就放出编辑原生图片。

参考资料:https://x.com/dr_cintas/status/1903112910735339984

ad1 webp
ad2 webp
ad1 webp
ad2 webp