type
status
date
slug
summary
tags
category
password
icon
Domain & Institution
Author
Priority
Abstract
Creation Date
大家周末好呀!
MiniMax 本周仿照起了OpenAI 和 DeepSeek开启了一次为期 5 天的发布周,发布了不少干货。
正好,趁着周末的时间,整理回顾了一波这一周他们究竟发布了哪些猛货。
那我们就直接开始!

01 | MiniMax M1

MinMax M1模型 是本周发的第一个干货。
它是 MiniMax的第一个深度思考模型,与它同类型的还有DeepSeek-R1 和 OpenAI 的 O 系列模型等。
它的第一个特点是,它的上下文长度达到了 1 百万的 Tokens,与它相当的,达到这个量级的,只有Google 家的 Gemini 系列。 但是,它与Gemni最大的不同的点是,它是开源的。
它的第二个特点是来自于它超级长的思维链,有两个版本,一个 40k,一个 80k。但从另一个角度讲,它因为想的多,也就会回答的慢。 如果你不知道 80k 的思维链长度到底有多离谱呢,就对比下,DeepSeek 就知道了。DeepSeek 的上下文长度官方支持的也不过才 64k,而这还远不到MiniMax的极限。
关于它的超长文本能力,我也做了比较详细的评测➡️:DeepSeek用户看过来:这个开源模型的上下文是它的15倍,还能思考80k字

02 | Hailuo 02

第二个猛货,就是海螺 02,这个全新的视频生成模型,在 artificial analysis 这个榜单上,图生视频排到了第二名。
但实际上,它不仅图生视频很猛,文生视频也同样不差。
它最大的突破点是,人物终于能做高复杂的动作了,甚至包括是耍杂技、进行体操运动。
有关海螺这个新模型的人物做复杂运动的能力,我也进行了比较多的对比测试,对比了可灵 2.1 大师版、即梦 3.0、即梦 3.0 Pro、还有 Veo 3,发现确实是有水平的,很多高难度复杂的动作,都基本能做出来,而且都没啥大毛病的。

03 | MiniMax Agent

说完了深度思考模型和视频生成模型,总算是到了 MinMax 这周新发的 Agent 产品, MiniMax Agent。强烈推荐大家都去试一下这个产品,不仅支持 MCP 服务,而且也支持多模态的输入输出,效果真的很牛逼。
唯一的问题是比较消耗积分(其实,Agent 产品都会有这类问题,因为他们执行步骤多,等待时间长),目前定价如下:
notion image
使用链接➡️:https://agent.minimax.io/
今年算是 Agent 发展的第一年,我们已经看到了太多 Agent 的产品,无论是通用领域,还是垂直领域,各类 Agent 真的层出不穷,真的很期待之后 Agent 能发展成什么样子。

04 | Video Agent

如果说,MiniMax Agent 是一个通用领域的 Agent,那Video Agent就是专精于视频领域的垂类 Agent。目前,这个 Agent 还处在第一阶段,用户只需要上传图片,选择想要的模版,就可以生成一段有意思的视频,无需亲自动手,剪辑,拼接。
下面是我使用 Video Agent 生成的一个视频的链接:
这个 Video Agent 之后也会开放更多的功能。
使用地址➡️:https://hailuoai.com/
大家多去试试呀,非常好玩的一个功能!

05 | 声音突破

如果说 Claude 的优势是代码,Gemini 的优势是多模态,那 MiniMax 的优势就是声音。
前面发了推理模型,涉足了视频生成以及 Agent,怎么能少得了声音突破呢。
现在,你只需要通过 prompt 描述,就可以获得一段高度定制化,饱含情绪的声音。之前 ElevenLabs 也推出了相似的功能。
下面是我的测试的几个例子:
  1. 只听见一个清脆悦耳的女声,带着抑制不住的兴奋传来:"天啊!真的吗?我简直不敢相信!"她的声音像银铃般清亮,每个字都跳跃着喜悦的音符。
  1. 一个年轻女性的声音,语调轻快上扬,充满难以抑制的喜悦和激动,声音清脆如银铃般悦耳。“天啊!我被录取了!就是那个梦想中的设计学院,他们还给了我奖学金呢!”
  1. 女声起初故作轻松,略带颤抖地强撑着平静,但说到一半声音突然哽咽破碎,转为压抑的哭腔,充满了无法掩饰的悲伤。"我没事的,真的没事……他说分手就分手吧,我……我真的……"(声音突然崩溃)"为什么要这样对我……"
感觉第三个例子还是稍微差了点意思,情绪转换演绎的不够到位。前两个确实不错。期待 MiniMax 能够继续突破,打磨提升好这个功能!
 

写在最后

Andrej Karpathy 2023 年的时候已经预测过接下来最火热的编程语言是英语。
notion image
更准确地说,其实就是自然语言。
这一观点在短短两年后的今天,已经不断地被验证。
使用自然语言开发一款软件似乎已经不是什么新鲜的事情。
而 MiniMax 通过这一周的发布会,向我们证明了,人们不仅可以用自然语言开发软件、还可以创造视频短片(甚至无需剪辑)、制作PPT、写长篇的报告,甚至还可以生成美妙的声音。自然语言已经融入了我们日常几乎所有的工作流中。
尽管有的功能可能还没那么完美,但是不完美才是迎接未来到来的常态。
期待 MiniMax 在通往 AGI 的道路上带我们领略美丽的风景,
因为这个世界上最美的风景正是我们见过。
 
感谢您读到这里!若觉得内容有帮助,欢迎点赞、在看、关注。别错过更新,给公众号加个星标⭐️吧!期待与您的下次相遇~
 
 
 
 
 
 
 
 
 
 
May 24, Prompt Engineering Mar 24 Notes on LightRAG
Loading...
BubbleBrain
BubbleBrain
BubbleBrain
Latest posts
MiniMax 发布周回顾
Jun 23, 2025
Mar 24 Notes on LightRAG
Mar 24, 2025
Dec 6, Some Tests on o1
Mar 14, 2025
Mar 10, Note on BIG-MATH
Mar 10, 2025
Mar 6, Note on QwQ-32B
Mar 6, 2025
Jan 21, Notes on DeepSeek-R1
Mar 6, 2025
Announcement
🎉欢迎来到 BubbleBrain🎉 
To find me:
Twitter/X:My X
👏Have fun in my blog👏