界面新聞記者 | 伍洋宇
界面新聞編輯 | 文姝琪
Minimax也辦起了技術發布周。前兩日,它在模型和產品上發布了重要更新,包括一款456B參數大小的推理模型M1,以及其核心產品海螺AI。
M1是Minimax姍姍來遲的首款推理模型,不免得要與DeepSeek-R1作比較。其兩個最大亮點,一個是長文本處理能力,另一個是成本表現。
Minimax-M1支持最高100萬token上下文輸入,達到DeepSeek R1的8倍,在閉源模型中與谷歌Gemini 2.5 Pro一致,同時支持最長8萬Token的推理輸出。
在實際應用中,即用戶給到一份100萬token大小的閱讀材料并提出需求,M1可以正常執行,但如果是不支持如此輸入長度的模型,可能只會顯示閱讀了一定比例內容并執行需求。
Minimax在其技術報告中寫道,M1之所以能夠實現長文本處理能力突破,主要得益于Lightning Attention(閃電注意力)混合構架。
傳統Transformer架構在處理長文本時,其注意力機制主導下的計算量增長為平方級,文本序列越長,計算量越發陡增,這對性能和成本均為挑戰。
Lightning Attention的做法是,將全連接注意力拆成兩大部分,一個是針對局部上下文整合、采用傳統注意力機制的“塊內”attention,一個是針對全局摘要、采用線性注意力的“塊間”attention。這一方案可以減少大量累積性的計算量,并提高處理速度。
成本方面,其報告提到,在進行8萬Token的深度推理時,M1所需的算力為DeepSeek R1的約30%;生成10萬token時,推理算力約為DeepSeek R1的25%。團隊表示,M1模型的整個強化學習階段僅使用了512塊英偉達H800 GPU,耗時三周,成本為53.5萬美元
在這一點上,Minimax提出了CISPO(Clipped IS-weight Policy Optimization)算法。這是一種高效率、高穩定性的強化學習策略,相比于PPO策略實行token級別的裁剪更新,它通過裁剪重要性采樣權重提升強化學習效率,類似“序列級別”裁剪。
這使其更快實現收斂,并達成更少的訓練時間和資源消耗。其報告中的實驗數據顯示,在AIME(AI-powered Moral Evaluator)等測試中,CISPO的收斂性均快于DAPO算法和GRPO算法。
定價方面,M1根據文本大小分為三個價格區間:0-32k Token,輸入0.8元/百萬Token,輸出8元/百萬Token;32k-128k Token,輸入1.2元/百萬Token,輸出16元/百萬Token;128k-1M Token,輸入2.4元/百萬Token,輸出24元/百萬Token。
這是一個總體相對較低的定價,但也同時意味著,隨著文本輸入與輸出的增長,用戶的token消耗費用也可能面臨陡升。
再說產品,海螺AI加入了全新Hailuo 02模型,視頻可原生1080P。Minimax此次強調了它處理極端物理場景的能力,比如說雜技。官方放出來的演示視頻也是一段雜技表演。
在AI視頻競技場的排行榜(Artificial Analysis Video Arena Leaderboard)中,Hailuo 02(0616)目前位居第二,僅次于字節旗下視頻生成模型Seedance 1.0,超過了谷歌Veo 3 preview以及快手Kling 2.0。
事實上,在此之前,Minimax在一眾大模型創業公司中就是一個以多模態能力見長的玩家,為什么在DeepSeek-R1掀起巨浪近半年之后(期間Kimi、智譜、階躍都有在這方面所更新和發布),它仍要完善推理模型的能力版圖?
一名AI大模型投資人對界面新聞記者表示,從時間線上來看,Minimax沒有在OpenAI o1模型掀起范式變革后,在國內整體而言相對早的時間點發布一款推理模型,大概率是核心團隊起初在決策判斷上沒有給到這個訓練方向足夠的重視。“這是團隊必須補的一課。”
另有一名接觸過Minimax的投資人認為,Minimax現在向市場發布推理模型的重要意義,一是說明在技術上不掉隊,二是用“唯一一個支持超長文本”的推理模型建立用戶心智。“這對資本市場還是有影響的。”這名投資人表示。
除此以外,他認為此次M1發布即開源,如果模型的效果和口碑能夠保持住,也可以讓Minimax借機將以前相對短板的開發者社區運營起來。目前,國內更受開發者認可的仍然是通義千問和DeepSeek。
在成本和長文本之外,回到基準測試等基本問題上,MiniMax-M1也有不俗表現。它在AIME 2024、LiveCodeBench、SWE-bench Verified上,略遜色于DeepSeek-R1-0528,不過在TAU-bench上有所趕超。
在體現長文本處理能力的MRCR(4-needle)上,它的確為開發者留下了深刻印象,大幅超越了一眾開閉源模型。

不過它究竟能夠對開源社區產生多大影響還有待觀察。在Github上,M1發布8小時后獲得440星,截至目前得到了620星。