|
DoNews1月21日音尘,The Information 月初爆料称,DeepSeek 将在本年 2 月中旬农历新年时代推出新一代旗舰 AI 模子 ——DeepSeek V4,将具备更强的写代码才调。 1 月 20 日,只怕 DeepSeek-R1 发布一周年之际,米兰体育官网有配置者发现 DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代码,横跨 114 个文献中有 28 处齐提到了未知的“MODEL1”大模子记号符。 该记号符与已知的现存模子“V32”(即 DeepSeek-V3.2)被并排或区别说起。凭据代码高下文分析,亚博体育“MODEL1”很可能代表一个不同于现存架构的新模子。 配置者分析合计,“MODEL1”与“V32”在要害技艺上存在区别,主要体当今键值(KV)缓存的布局、疏淡性管制形貌以及对 FP8 数据姿色的解码复旧等方面。这些相反标明新架构可能在内存优化和蓄意着力上进行了针对性设想。 此前,DeepSeek 议论团队前几天还接续发布了两篇技艺论文,分辩先容了名为“优化残差贯串(mHC)”的新历练要津,以及一种受生物学启发的“AI 记挂模块(Engram)”。技艺社区臆测,正在配置中的新模子有可能会整合这些最新的议论效果。 |


备案号: