网站地图收藏本站

科技魔方 > 聚焦 >

OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密

编辑：柳暮雪时间：2025-02-17 14:53 来源：中国网阅读量：8044

在中国AI公司的影响下，OpenAI 不得不公开O系列强化学习的秘密。近日，OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》，文中放出了OpenAI三个推理模型:o1、o1-ioi、o3在IOI和CodeForces(全球知名在线编程竞赛)中的成绩。

论文显示，在IOI 2024中，o3在严格规则下拿到395.64分，达成金牌成就，并且在CodeForces上的表现与人类精英选手相当。论文中特别提到，中国的DeepSeek-R1和Kimik1.5通过独立研究显示，利用思维链学习方法，可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。

OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密

该论文通过强化学习训练的大型语言模型在复杂编码和推理任务上的性能提升，比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明，增加强化学习训练计算和测试时计算可显著提升模型性能，使其接近世界顶尖人类选手，这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

推荐

酷睿i9-13900K/i5-13600K首发评测：ROG MAXIMU

一、前言：升级版的Intel7制程工艺带来更好的13代酷睿原本对13代酷睿没有太大期待，毕竟构架没有大改，制程工艺还是Intel7，i9-13900K最...
性价比狂虐RTX 3060！Intel Arc A770/A750显卡首

一、前言：Intel的高端显卡终于来了4个月前，Intel发布了20多年前来旗下第一块面向桌面游戏的独立显卡--ArcA380（中文名锐炫A380）。在...
上市仅两个多月，保时捷将加入德国蓝筹股DAX指数

12月6日，买车网Buycar获悉，据外媒报道称，德国证券交易所DeutscheBoerse表示，德国豪华车品牌保时捷将加入蓝筹股DAX指数，这距离其上...

图文

头条

最新