国产大模型MiniMax 2.7本周开源,小龙虾Token更便宜。
4月7日最新消息显示,小龙虾OpenClaw近期热度持续上升,但多数用户在使用过程中主要消耗的是Token词元费用,这一现象也促使国产大模型迅速崛起,其中MiniMax2.7在调用量方面长期位居前列。 从当前市场表现来看,用户对AI模型的依赖程度加深,而Token成本成为影响使用体验的重要因素。这不仅反映出技术应用的普及,也揭示出底层资源消耗的现实问题。与此同时,国产模型的快速成长,显示出国内企业在大模型领域的竞争力正在不断提升,未来有望在更多场景中实现突破。

MiniMax2.7大模型已经发布了一段时间,但一直未有开源的消息。近日,官方在Huggingface社区透露了具体的开源计划,对OOS开发者表示歉意,承认他们低估了开源所需的工作量,目前仍在进行一些基础设施的适配工作,预计本周末将正式发布MiniMax2.7的开源版本。

MiniMax2.7的开源不仅对开发者具有重要意义,普通用户同样能够从中受益。开源之后,其他平台也能够部署MiniMax2.7,这有助于提升该模型的可用性,同时也有望降低使用成本,让像“玩转小龙虾”这样的应用享受到更便宜的Token费用。 从行业角度来看,开源是一种推动技术普及和生态建设的重要方式。它不仅促进了技术共享,也为更多企业和个人提供了参与和创新的机会。随着更多平台接入,MiniMax2.7的应用场景将更加广泛,用户体验也将随之提升。这种开放合作的模式,有助于形成良性循环,推动整个AI领域的发展。
此前在Anthropic宣布禁止OpenClaw等第三方接入后,MiniMax方面曾发表意见,表示不认同这一做法,认为此举可能会抑制一些创新想法。MiniMax强调,其Token计划从最初设计时就旨在支持跨第三方平台的使用。
MiniMax2.7大模型于3月18日发布,距离春节前夕推出的MiniMax2.5仅过去一个多月,迭代速度非常之快,被称作是稀宇科技首次深度参与自身模型迭代的成果。 此次快速迭代反映出企业在技术研发上的高效与投入,也显示出其在人工智能领域持续发力的态势。短时间内推出新版模型,不仅体现了技术积累的厚度,也暗示了市场对产品更新的迫切需求。这种高频次的版本更迭,或许将推动行业整体技术水平的提升,同时也对用户和开发者提出了更高的适应要求。
其提升主要集中在三个方面,官方介绍如下:
1. M2.7 在真实的软件工程中有优异的表现,包括端到端的完整项目交付,分析日志排查 Bug、代码安全,机器学习等。在基准测试 SWE-Pro 中,M2.7 得分56.22%,几乎接近Opus最好的水平。
这一能力同样应用到了端到端的完整项目交付场景(VIBE-Pro 55.6%)以及对复杂工程系统的深入理解(TerminalBench 2,57.0%)。
2.在专业办公领域,模型的行业知识储备和任务执行能力得到了显著提升。在GDPval-AA测试中,其ELO得分为1495,位居开源模型中的最高水平。M7在Office三大核心应用——Excel、PPT和Word的复杂编辑功能上实现突破,能够更高效地支持多轮修改与高精度内容编辑,进一步增强了实际办公场景中的适用性。 从行业角度看,这一进展标志着大模型在垂直领域的专业化能力正在不断深化,尤其是在办公软件这类高频、高要求的场景中,技术进步直接关系到用户的使用体验和工作效率。随着模型对专业工具理解的加深,未来在智能办公、自动化文档处理等方面或将带来更大变革。
M2.7具备与复杂环境交互的能力,在涉及40个复杂技能(超过2000个Token)的案例中,仍能保持97%的技能遵循率。这一表现显示出其在处理高难度任务时的稳定性和可靠性。从技术角度看,这种能力意味着系统在面对多变、复杂的现实场景时,能够有效理解和执行指令,具备较强的适应性与精准度。对于人工智能的发展来说,这样的成绩具有积极意义,也预示着未来在实际应用中的潜力。
在OpenClaw的使用中,M2.7相较于M2.5实现了显著的性能提升,在MMClaw的评测中已接近最新的Sonnet4.6版本。
3.M2.7拥有出色的身份识别能力和情感互动水平,除了在生产力领域的应用外,也为互动娱乐场景的创新提供了可能性。