51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

用开源方法复现 DeepSeek-R1

DeepSeek 的最新模型 R1 过去几天引发了轰动,出色的性能和低廉的成本冲击了硅谷的 AI 叙事,以至于最大的 AI 芯片供应商英伟达的股价暴跌,市值蒸发了六千亿美元,迫使英伟达公开声明 DeepSeek 的业务仍然需要大量它的 GPU。DeepSeek R1 虽然声称是开源模型,但它只开源了模型权重,代码和数据集都没有公开。现在开发者宣布了一个真正的开源项目 Open-R1,试图复现 DeepSeek-R1。该项目旨在系统地重建 DeepSeek-R1 的数据和训练流程,验证其声明,突破开放推理模型的界限,为未来模型利用这些技术奠定基础。




Huggingface------Open-R1: a fully open reproduction of DeepSeek-R1

赞(0)
未经允许不得转载:工具盒子 » 用开源方法复现 DeepSeek-R1