国联民生证券:模型单位成本重要性不断提升 多模态与“视觉执行”走向前台
时间:2026-02-04 14:06:16
MINIMAX-WP
智谱
智通财经APP获悉,国联民生证券发布研报称,在传统对话范式下,单次交互仅需少数几次模型调用;但在工作流范式下,一个任务往往横跨计划、检索、工具调用、校验纠错及外部系统写入等多个阶段。相较基础聊天,面向复杂任务的agent服务可能会消耗数十倍多的token,模型单位成本的重要性在不断提升。Agent时代,大模型正从“聊天工具”进化为“自主员工”。掌握核心算法与行业接口的大模型厂商有望深度受益于万物智能化的红利,建议关注“大模型双子星”MiniMax-WP(00100)与智谱(02513)。
国联民生证券主要观点如下:
事件:截至2026年2月2日,Clawdbot在代码托管平台GitHub上的星标数量已超过13万个,官网累计访问量突破200万人次,成为近期增长最快的开源技术项目之一。以及近期出现的“AI-only社区”如Moltbook,该平台在极短时间内聚集了百万个代理账号规模,这类交互天然对应更高的请求密度与更频繁的API触发。其最直接的外显变量是API调用频次与token吞吐的阶跃式抬升。在Clawdbot创始人Peter Steinberger的力荐下,国内AI独角兽MiniMax旗下擅长长文本与逻辑推理的M2.1模型被成功带火。
模型单位成本的重要性在提升
在传统对话范式下,单次交互仅需少数几次模型调用;但在工作流范式下,一个任务往往横跨计划、检索、工具调用、校验纠错及外部系统写入等多个阶段。这导致模型调用频率、上下文长度及中间信息的复杂程度倍增。多步推理与多轮工具调用天然带来“多回合上下文”,同时重试与自纠错会额外产生无效token。相较基础聊天,面向复杂任务的agent服务可能会消耗数十倍多的token。
因此“模型的单位成本×单位产出”就变成了Agent类产品能否规模化落地的“生死线”——因为在执行任务时,多轮推理与工具协同将会把成本线性放大。正因如此,Clawdbot的创始人会直言推荐MiniMax,其M2.1模型的“兼具效率与成本的优势、长文本能力强、推理与编程能力”的特点符合当下众多用户的需求。
兼具效率与成本:M2.1模型旨在通过极致的成本优势解决当前开发者在自动化编程中面临的高昂token成本痛点,其定价体系约为Claude Sonnet的8%。且Coding Plan创新性地引入“每5小时重置额度”的高频刷新机制,打破了行业通用的按天或按月限额模式,释放了高频重度开发场景下的生产力。计费模式上,不同于底层大模型厂商通用的token按量计费(Pay-as-yougo)逻辑,公司转而采用分层月度订阅制。
长文本能力强:真实的工作流里,持续演进的上下文通常包含工具调用、历史信息、检索片段、约束条件等等。M2.1的长文本能力让它更适合完成“持续记忆”,即读更长的文档、容纳更多中间结果、减少因截断导致的逻辑断裂。
推理与编程能力:在Clawdbot这种强调自动化执行与纠错闭环的产品里,模型被用于写代码、改代码、做判断、做校验。M2.1在推理与编程能力上的“够用且性价比极高”,使它成为最适合被放进生产系统、被高频调用的选择。
国联民生证券指出,在Agent时代,“谁更聪明”固然重要,但更重要的是“谁能以更低成本把强能力变成高频可用的生产力”,这是MiniMax的优势所在。
多模态与“视觉执行”走向前台
Agent进入办公与生产场景后,输入不再主要来自纯文本,而大量来自截图、PDF、表格、图表、界面元素等视觉信息。在Clawdbot这种“能执行”的工作流里,用户不仅输入结构化文本,同时也伴随着截图、网页界面、报错弹窗、表格/图表或PDF页面等。
MiniMax的多模态能力辅助Agent更好地理解界面、提取关键信息、输出可执行的步骤/代码、再用截图回读做校验纠错。这让Clawdbot可以做“视觉驱动的自动化”:例如识别表格字段后自动填表、读报错截图后定位原因并改脚本、从图表中抽数并写入报告、对比前后截图确认任务是否真正完成等等。MiniMax凭借自己的多模态能力,能更好的完成服务的闭环、减少人工转述、快速纠错,达到更强的可交付性。
风险提示
技术路线变革具有不确定性;行业竞争加剧。
免责声明:本资讯不构成建议或操作邀约,市场有风险,投资需谨慎!


