国产开源大模型DeepSeek R1惊艳亮相,性能超OpenAI o1,成本直降九成
科技
2025-01-21 10:13:27
导读 DeepSeek团队近期推出的最新开源大模型R1,在性能上超越了OpenAI的o1模型,特别是在数学和编程测试中表现突出,如在AIME2024、MATH-500及SW
DeepSeek团队近期推出的最新开源大模型R1,在性能上超越了OpenAI的o1模型,特别是在数学和编程测试中表现突出,如在AIME2024、MATH-500及SWE-bench Verified等测试中均取得更高分数。同时,R1在成本上具有显著优势,每100万tokens的输入和输出费用分别仅为o1的1/107和1/27,这一巨大差异使其在开源大模型领域备受瞩目。
R1模型的高效推理能力得到广泛认可,甚至被誉为“最像人类内心独白的模型”。其开发过程中采用了多阶段训练流程,提升了推理能力和可读性。R1的发布不仅标志着中国在大模型技术领域的进一步突破,也推动了开源技术的发展,引发了国际市场的广泛关注与讨论。