当代职场人最烦两件事,一是开会,二是线上开会。
我们常常把开会视作头脑风暴、思维碰撞的绝佳场所,辅以office、pdf等线上文件处理工具,打破了空间限制,似乎又延伸了思维拓展的边界。
但现实是,语言限制了思想表达的完整性,各类工具占满了电脑内存、烧干了CPU,不同文件用不同工具打开,满满当当的电脑屏幕,让人恨不得生出四双眼睛。
大模型时代,职场人对AI创作寄予厚望,可chatbot上来一个“how can I help you today”对话框就让语言的壁垒重现:该说什么才能让chatbot尽快理解我的需求?
我们希望chatbot能代替自己的眼睛和大脑,以更高的效率消化各类素材,将头脑风暴的范围限制在chatbot的一个界面里,以更高的密度和更小的信息传输损害,实现更精准地输出。
但“格式”成为了素材交融的最大屏障,降低了思维碰撞的效率和思维融合的范围,产出的文章、PPT、海报,总不尽如人意。
AI创作要真正改变职场人和创作者的困境,核心不在于提供一个对甲方需求永远耐心的“实习生”,而是一个打破语言、工具界限,思想碰撞更加高效无阻的思维宇宙和趁手可用的“小能手”。
从这一思路出发,2025年,一场AI创作的“拨乱反正”已经开始了。
格式无界,创作无界
两个月前,李彦宏在百度世界大会上亲自推荐了一款产品——“自由画布”,向AI创作的思维壁垒开了第一枪。
“自由画布”主打多格式、全模态文件的理解、生成、创作能力,不管素材有多少种文件格式,“一圈一拖”即可实现一站式、多线程地素材的消化和结果的输出。
“画布”的概念由来已久,上次引发瞩目是在2022年苹果在iPad上引入“无边记”。总结其为何打动创作者,其实是尊重了创作的天马行空,理解了灵感是迸发于不同素材之间的化学反应里的,为此作的努力是包容更多的素材,让这种化学反应来得更猛烈一些。
百度文库“自由画布”在做的是类似的事。
创作的过程可以概述为“输入->输出”的过程,输入素材的类型丰富程度、数量规模都极大程度地影响“输出”的表现。但市面上的chatbot的普遍困境是,输入端“要素”过多导致超载。
我们日常创作需要的素材格式有超过100种,视频有mp4/avi/rmvb,文字资料有doc/epub/txt,图片有jpg/gif/png,处理起来仿佛八国联军会晤,沟通需要翻译,作战风格需要磨合。
过去没有大模型,我们也免不了在电脑上下载各类App,以避免“文件格式不支持”的窘境,chatbot不只是要支持不同格式的素材的呈现,还要能解读、生成,难度更大了。
自由画布依托于百度文库和百度网盘的全面打通,覆盖了我们日常创作中会用到的大部分素材格式,并且通过“一拖一圈”的极简操作,辅以自然语言对话,打破了过往AI创作类产品的单一交互方式。
例如写一篇《小巷人家》的剧评,需要的素材包括电视剧片段、剧照、剧情梗概、社交平台评论,延伸一些还包括主创幕后采访(文字/视频)等,创作者可以在将它们全部拖到一块“画布”上,或者直接从百度网盘一键上传。
每个素材都可以进行针对性解析,根据素材的内容,可以通过「一圈」的方式,分门别类地选择参考逻辑结构、语言风格、主要观点等等,实现灵感的激发和个性化内容的创作。
创作者在此基础上进行进一步筛选后,用鼠标圈定出可用的素材,点击“生成文档”,确认大纲后即可生成文档,生成的文档中会理解素材,并直接在合适的位置插入素材。
初稿不仅可修改(自由画布不仅内置编辑器,还能用AI对选定段落进行改写、扩写、写作风格的更改等等),还可以作为素材与其他素材再次“化学反应”,循环“一拖一圈”的步骤迭代到第二版、第三版。
自由画布的灵魂是“自由”,旨在提供一个不受限于格式的素材池,为创作者开辟一个无拘无束、充分拓展的思维空间,再辅以实用性更强的“AI小能手”,是思维空间,更是创作空间。
哆啦A梦的口袋
欧洲的民俗传说中有一双著名的“七里靴”,《浮士德》里的恶魔穿着它追赶浮士德“一步七里”。
创作者对AI创作的实际诉求类似于“七里靴”,本质是让创作的每一个步骤都拥有更高的效率、范围更大的延伸,而不是让chatbot代替自己去创作,让“七里靴”代替自己去跑。
传统的chatbot限定了创作者以对话的形式“告诉”chatbot自己的需求,实际上是放弃了一部分“只可意会不可言传”的信息,造成产出与需求的错位,所以创作者普遍有这样的困惑,“明明该说的都说了,为什么chatbot写的文章还是不符合我的要求?”
自由画布在流程和功能设计上的“拨乱反正”由此入手,一个个功能明确的按钮取代了逼迫人咬文嚼字的对话框,就像windows自带的画图软件,看着死板却“开箱即用”。
功能设计则将重点放在提高重复性强、依赖算力的环节的效率以及素材的延伸和拓展,在这个过程中,各个“输出”关键节点的“确定权”仍在创作者手中,打造了一个流程可控、多任务并行、公私域内容全面打通的高效创作空间。
假设要做一个有关“中国电动车技术发展现状”的ppt,可以上传一个内容弱相关、但布局风格可以借鉴的ppt,仅选择“使用当前模板”,内容方面,则可以上传机构报告、行业分析等,参考其中主要观点或文字风格。
相当于在“输入端”划了重点,输出就会更精准、更符合需求,事半功倍。
在圈定好各个素材的参考侧重点后,生成具体文章前还会给出文章大纲,给了创作者修改文章思路的机会,不满意则重新生成或者添加新的素材。
多任务并行则是自由画布区别于主流AI创作应用在效率上的独有的优势。
目前市面上大部分chatbot采用的是串行模式,即同一时间只执行一个操作,就像开篇描述的“干瞪进度条”,是工作效率的洼地——人类工作还能一边开电话会议一边写材料呢。
自由画布可以一边做视频素材的内容总结,一边做文字素材的观点提取,这种并行操作更符合打工人“一边做渲染一边剪片子”的日常,工作效率提升了几个层级。
百度文库、百度网盘的公私域全面打通,配合AI全网搜,则是给自由画布“开了挂”。
比如做“中国电动车技术发展现状”ppt,可以从网盘、文库一键上传相关公司的财报、发展历程和行业报告;已有的素材里行业数据太老需要更新,直接点击下方的“AI全网搜”按钮、搜索到最新数据后点击确认,再做类似的“划重点”操作。
自由画布集成了全新的智能生产力,充分赋能创作者,就像哆啦A梦的口袋之所以成为童年梦想,不是因为提供了唾手可得的成果,而是让我们变成了更强大的人。
AI创作重定义
人工智能早在2012年就成为显学,但直到大模型给人工智能带来了“生成式”的前缀,才开始在产业引发海啸。“生成”即是生产力的显化,结合当代生产力的组成,以“生成文稿”、“生成绘画”为代表的AI创作,便成为了大模型公司最早发力的领域。
但直到现在,真正在职场上发挥作用的AI创作产品屈指可数。
2024年高喊着“大模型落地元年”的口号到来,但AI创作却似乎进入了冷静期,无论是大模型公司还是创作者,都开始审视大模型的输出是否与创作者的真实需求对齐。
总结了主流产品的推广困境,自由画布主要聚焦于两个思路做突破:一是交互上的全面革新,二是充分理解“AI+创作”,不仅真正实现了all in one的一站式满足,还带来全新的解法。
交互的问题主要来自于ChatGPT爆火带来的先入为主。
在一些特定场景中,“对话”确实是更好的交互方式,比如手机AI管家、智能家居等,共同点是需要处理的都是标准化的事务性工作,比如打车、订餐厅座位、空调自动调节等,也就是说评判标准是“最没做到”,而不是“好不好”。
AI创作与这些工作的核心区别在于,其输入和输出都是风格化、个性化的,充满了主观的、难以用语言概括的输入和评判标准,因此要做的是把创作的主导权还给创作,大模型的角色不是「助手」,而是一个帮助创作者提高效率的「能手」。
由此诞生的自由画布,充分给予用户交互上的自由,从目前的反馈来看,其有别于其他AI创作产品的在线编辑器、多格式支持、多线程并行、让用户普遍感觉“比想象的好用”。
而百度有意的“功能留白”,也给自由画布更加完善的未来留下了想象空间。
比如自由画布基于网盘、文库底层打通、格式打通,如果生成的作品可以通过链接分享给他人,有望开拓一个“共同创作”的空间,即同一作品可以由多人完成、多层级修改、多线程处理,很适配于文化创意产业的协同模式,也开辟出了全新的AI创作场景。
2024年结束了,有遗憾也有沉淀,自由画布的登场,已经给2025年AI创作的新叙事铺垫了一个好的开头。
参考资料
[1]Computing inside an AI, Will Whitney
[2]为什么聊天机器人界面不是未来,无界社区mixlab
[3]AI产品形态交汇的背后:Canvas, Artifacts, Cursor and more,左右横眺
作者:何律衡
编辑:李墨天
视觉设计:疏睿
责任编辑:何律衡
封面图片来自ShotDeck