,4月30日,小米正式推出首个专注推理能力的开源大模型#8204;Xiaomi MiMo#8204;,以7B参数规模在数学推理和代码竞赛(LiveCodeBench v5)测评中超越OpenAI闭源模型o1-mini及阿里32B参数模型QwQ-32B-Preview。
MiMo的核心突破在于通过预训练与后训练联动策略激发模型潜能:
预训练阶段#8204;:构建200B tokens专用推理语料库,采用三阶段递进式训练,累计训练25T tokens以强化复杂逻辑处理能力;
后训练阶段#8204;:创新性引入“Test Difficulty Driven Reward”算法动态分配奖励,缓解强化学习中的稀疏性问题,并通过“Easy Data Re-Sampling”策略稳定训练过程。
该模型系列已在HuggingFace开源,代码库采用Apache2.0协议,同步公开26页技术报告。
作为小米大模型Core团队的首秀,MiMo以“小参数量、高推理效率”展现技术实力,推动公司股价当日上涨4.74%。此举标志着小米在AI竞赛中迈出关键一步,为智能终端生态注入新动能。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
一、前言:升级版的Intel7制程工艺带来更好的13代酷睿原本对13代酷睿没有太大期待,毕竟构架没有大改,制程工艺还是Intel7,i9-13900K最...
一、前言:Intel的高端显卡终于来了4个月前,Intel发布了20多年前来旗下第一块面向桌面游戏的独立显卡--ArcA380(中文名锐炫A380)。在...
12月6日,买车网Buycar获悉,据外媒报道称,德国证券交易所DeutscheBoerse表示,德国豪华车品牌保时捷将加入蓝筹股DAX指数,这距离其上...