2024年,是AI技术飞速发展的一年,AI从单一任务向多模态、多任务实现了跨越,大模型市场从拼参数的“百模大战”到了拼落地、拼应用的新阶段。AI应用在多个行业逐步深化,大模型则推动了传统产业变革,为新质生产力赋能,对各行各业都产生了深远的影响。随着中国人工智能的飞速发展,AI已经变成了我们生活里的一部分。
2024年,对MiniMax公司而言是充满挑战与收获的一年。我们坚持技术创新,在文本、图像、语音&音乐、视频等多个模态的模型算法发力,力求实现技术突破,加快实现通用人工智能的步伐。在文本模型上,我们在上半年就推出了国内首个上线商用的MoE架构、包含万亿参数的大语言模型abab 6.5。在多模态领域,MiniMax语音大模型speech-01已经实现了世界Top 2大规模商用,同时推出了国内首个可以对标OpenAI的Realtime API服务,提升了端到端实时多模态处理能力。去年下半年,MiniMax推出的视频模型video-01在国际多个权威榜单评测得分领先,受到超过200个国家和地区创作者的好评。
回望过去一年,我们走过弯路,也总结了很多经验。我们发现,AI时代不能套用上一代移动互联网产品方法论来思考新产品。AI大模型和产品的真实关系是更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。也正因把技术迭代设立为了核心目标,我们才成为了中国大模型公司中,为数不多的能不依赖于推广,以好技术为替代来驱动好产品,并在全球收获相对还不错的口碑的公司,这是我们2024年的幸运。
2025年是AI行业发展的关键一年,也是AI Agent大放异彩的时代。新的一年,加速技术迭代仍是MiniMax最重要的目标。新年伊始,我们接连发布了提供主体参考功能的视频模型S2V、新一代开源模型MiniMax-01,以及在多语种表现优异的语音模型T2A-01-HD。选择对MiniMax-01开源,一是因为我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。
长上下文能力与多模态处理能力的提升,是AI Agent为各行业带来更为丰富、高效、智能的解决方案的必要条件。现在,我们迈出了建立复杂Agent基础能力的第一步。在机遇和挑战并存的未来,MiniMax会继续坚持技术驱动,把每一步做扎实,才能推动AI技术在更多领域的落地,为AGI的更快到来尽全力。(经济观察报 记者 任晓宁)
任晓宁经济观察报记者
TMT新闻部资深记者
关注并报道TMT(科技、传媒、通信)领域重大事件,擅长行业分析、深度报道。
联系邮箱:renxiaoning@eeo.com.cn
微信号:tangtangxiaomo