凯时官网

目今位置: 首页 > 体育 > 综合

曝DeepSeek新模型Model1:疑似“高效推理模型”

2026-01-21 22:45:23

体育播报1月21日宣 DeepSeek于官方GitHub货仓更新了一系列FlashMLA代码 ,在这些更新中 ,一个名为“Model 1”的模型引起了广泛关注。

凯时游戏·(中国)集团

据悉 ,目前这个还很神秘的Model1不但泛起在了代码与注释中 ,甚至另有与DeepSeek-V3.2并驾齐驱的文件。这也不禁引发宽大网友推测 ,认为Model 1很可能就是听说中DeepSeek将于春节前后宣布的新模型代号。

最新消息显示 ,Model1是DeepSeek FlashMLA中支持的两个主要模型架构之一 ,另一个是DeepSeek-V3.2。这很可能是一个高效推理模型 ,相比V3.2内存占用更低 ,适合边沿设备或本钱敏感场景。别的 ,它也可能是一个长序列专家 ,针对16K+序列优化 ,适合文档理解、代码剖析等长上下文任务。

网站地图