AI“以小博大”新标杆:三星开源TRM模型,挑战谷歌与OpenAI
创始人
2025-10-10 16:00:53
0

IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

该 AI 模型由三星高级 AI 研究院(SAIT)高级 AI 研究员 Alexia Jolicoeur-Martineau 发布,成为 AI 领域“小模型”对抗“大模型”的趋势的重磅新案例。

该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正,每一步都纠正前一步的潜在错误,直至答案收敛稳定。

TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

尽管模型极小,TRM 在多个基准测试中展现了“以小博大”的惊人实力:

  • 在 Sudoku-Extreme(极限数独)测试中,其准确率达到 87.4%;
  • 在 Maze-Hard(困难迷宫)中达到 85%;
  • 在衡量抽象推理能力的 ARC-AGI 测试中准确率为 45%;
  • ARC-AGI-2 的准确率为 8%。

尽管 TRM 使用的参数不到 0.01%,但这些结果仍然超过或接近几种高端大型语言模型的性能,包括 DeepSeek R1 、 Gemini 2.5 Pro 和 o3-mini 。

然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。

IT之家附上参考地址

相关内容

热门资讯

一分钟教会你!微乐a3纸牌有脚... 微乐a3纸牌有脚本是一款专注玩家量身打造的游戏记牌类型软件,在微乐a3纸牌有脚本这款游戏中我们可以记...
玩家必备科技!闽游app辅助器... 【亲,桂林字牌辅助科技 这款游戏可以开挂的,确实是有挂的,很多玩家在这款桂林字牌辅助科技中打牌都会发...
盘点一款!老友广东潮汕麻雀,新... 盘点一款!老友广东潮汕麻雀,新星游辅助软件(有挂助手开挂辅助挂);无需打开直接搜索打开薇:13670...
推荐一款!广西友乐解码器辅助器... 推荐一款!广西友乐解码器辅助器,指尖四川辅助脚本(有挂详情辅助开挂器)这是一款可以让一直输的玩家,快...
泰山电影学院正式亮相,融合“电... 春节祥临齐鲁地,泰影新诞岱云间。在人工智能重塑影视产业的大势下,一所融合传统影视教育与前沿技术的应用...
必知教程!广东雀神挂件脚本开挂... 必知教程!广东雀神挂件脚本开挂,小闲川南辅助(有挂教学辅助软件)您好:广东雀神挂件脚本开挂这款游戏可...
发现玩家!唯思竞技修改器,情怀... 唯思竞技修改器是一款专注玩家量身打造的游戏记牌类型软件,在唯思竞技修改器这款游戏中我们可以记录下每张...
重大通报!菠萝神器辅助工具,葫... 重大通报!菠萝神器辅助工具,葫芦娃辅助器直装(有挂教学开挂辅助插件);无需打开直接搜索加薇13670...
总算了解!佛手十三道大菠萝辅助... 总算了解!佛手十三道大菠萝辅助,微友三代辅助(确实有挂辅助开挂脚本);无需打开直接搜索薇:13670...
最新通报!越乡游义乌透视软件,... 最新通报!越乡游义乌透视软件,新518互游插件(今日头条辅助开挂插件);无需打开直接搜索薇:1367...