作者 | 刘宝丹

编辑 | 黄昱

在经过两年的技术迭代后,2025年将是AI商业化落地的决胜之年。作为国内AI独角兽,MiniMax也开始发起冲刺了。

1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型能够高效处理高达400万token的输入,可输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。

这是全球首个大规模应用线性注意力机制架构的开源模型,背后承载的是MiniMax在技术和商业化应用方面的野心。

MiniMax成立于2021年,目前完成四轮融资,最近一次是2024年3月,由阿里领投,估值25亿美元,成为国内AI“六小龙”之一。从模型来看,MiniMax自主研发了多模态的通用大模型,其中包括万亿参数的MoE文本大模型、语音&音乐大模型等系列模型。

四个月前,在成立996天的伙伴日上,MiniMax创始人闫俊杰透露了公司商业化方面的考量。他表示,整个公司的商业化基本上分成两个形式,一个是开放平台,现在已经有两千多家的客户;第二点,在公司产品里面也有广告的机制。

彼时,MiniMax国际业务总经理盛静远表示,MiniMax现在是所有中国大模型公司里面,少数几个能讲商业化变现,能讲产品跟模型驱动,甚至很有可能能在比较短的时间内实现自负盈亏及盈利的公司。

如今,随着01系列模型的发布,MiniMax在AI大模型的商业化变现方面有望提速。

一方面,这主要是因为,新模型在输入长度方面取得了新的突破。

MiniMax-01系列模型首次将线性注意力机制(Linear Attention)扩展到商用模型的级别,这意味着,线性注意力机制从学术理论成功落地到模型应用层面。受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。

从ScalingLaw、与MoE的结合、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理高达400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。

而长文本能力是制约AI大模型商业化落地的核心元素,尤其AI Agent阶段正在加速到来,包含长文本在内的大模型性能将在市场中接受真正的考验。

2025年,AI将迎来至关重要的发展节点,AI Agent有望成为新一年最重要的产品形态,由于AI Agent处理任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。

在这种背景下,长上下文能力与多模态处理能力的提升,是AI Agent为各行业带来更为丰富、高效、智能的解决方案的必要条件,这也是MiniMax 01系列模型的最大亮点。

价格也是影响AI大模型落地的重要因素。华尔街见闻获悉,受益于Linear Attention层面的架构创新、算力层面的优化,以及集群上的训推一体的设计,MiniMax API服务的标准定价是输入token 1元/百万token,输出token 8元/百万token。

值得一提的是,MiniMax在Github上开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。

MiniMax表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”

不过,MiniMax要想在商业落地上取得更大的成绩,还面临AI技术迭代带来的不确定性,作为创业公司在应用生态上的不足,以及激烈的市场竞争,这些都会给公司带来压力。

以市场竞争为例,MiniMax想要打造出AI时代的杀手级APP。根据Sensor Tower数据,截至2024年8月,Talkie在全球AI应用下载榜上位居第12位,海螺AI在国内AI应用榜单也能排到TOP10。

虽然两款产品的成绩不错,但距离遥遥领先的ChatGPT和迅速蹿升的豆包,依然有不小差距.这背后可能反应了MiniMax在产品和市场方面的能力差距。

早在ChatGPT火爆出圈之前就已成立,MiniMax被认为是最有AGI愿景的创业公司之一。过去一年,MiniMax持续深耕技术和产品,并在2025年开年放出一枚重磅武器,颇有厚积薄发之势。

接下来就看MiniMax能否在商业化这条路上开花结果,这注定是一场极为艰难的硬仗。

ad1 webp
ad2 webp
ad1 webp
ad2 webp