
NVIDIA在7月20日的新闻中推出了一种新的推理模型Openrasoning-Nemotron。该套件包括基于QWEN-2.5设置的四个模型,参数尺寸为1.5B,7B,14B和32B,所有型号均为6710亿个参数,其中最大的R1 R1 0528 Model是DeepSeek中的R1 0528模型。通过“蒸馏”过程,NVIDIA在更轻的推理模型中压缩了该模型的超大型模型,从而降低了实现阈值,从而允许在标准游戏计算机中进行高级推理实验,从而避免了高计算成本和云计算机成本。根据Home的说法,这种NVIDIA模型的核心优势是其强大的数据支持,而不是培训方法中的复杂创新。该公司使用NEMO技能生成了500万个涵盖数学,科学和编程的解决方案,并通过纯监测的模型调整了该模型。测试后,32B模型在数学竞赛AIME24中获得了89.2分,在F的HMMT竞赛中达到73.8分EBUANE,甚至1.5B的最低模型分别获得了55.5和31.5分,证明了合法的推理和解决问题的技能。 NVIDIA将Openrasoning-Nemotron定位为探索科学研究的强大工具。四个模型的完整控制点是用拥抱面下载的,研究人员可以使用它来执行更多实验,例如增强学习或自定义特定任务的优化。同时,该模型允许“ Mensellect模式”。这意味着每个问题都可以生成答案的多个版本,从而改善精度过滤最佳解决方案。通过这种方式,具有多个数学和参考点程序CIA的OpenAI O3的高性能实现或超过了OpenAI O3的高性能。值得一提团结并促进对强化学习的未来研究。对于具有高性能游戏GPU的个别玩家和开发人员,该模型创建了推理模型,这些模型在该行业最高级级别附近执行。