人工智能

消息称 Meta 成立 4 个小组研究 DeepSeek，基于此来改进自家 Llama

2025-01-28 08:07:28人工智能 IT之家远洋

据 Information 网站，Facebook 母公司 Meta 成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型 DeepSeek 的工作原理，并基于此来改进旗下大模型 Llama。

感谢最新网友 Hi_World、HH_KK 的线索投递！

最新 1 月 27 日消息，据 Information 网站，Facebook 母公司 Meta 成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型 DeepSeek 的工作原理，并基于此来改进旗下大模型 Llama。

其中两个小组正在试图了解幻方量化如何降低训练和运行 DeepSeek 的成本；第三个研究小组则正在研究幻方量化可能使用了哪些数据来训练其模型；第四个小组正在考虑基于 DeepSeek 模型属性重构 Meta 模型的新技术。

1 月 20 日，DeepSeek-R1 推理大模型正式发布。据官方介绍，DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

最新注意到，今日 Deepseek 应用已登顶苹果中国地区和美国地区应用商店免费 App 下载排行榜，在美区下载榜上超越了 ChatGPT。