:::
2026-01-13
DeepSeek與北京大學合作發佈新論文 探討大型語言模型的記憶結構
【DeepSeek發佈梁文鋒署名新論文 開源相關記憶模塊Engram】DeepSeek於12日晚發佈新論文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基於可擴展查找的條件記憶:大型語言模型稀疏性的新維度)。該論文爲北京大學與DeepSeek共同完成,合著作者署名中出現梁文鋒。論文提出條件記憶(conditional memory),通過引入可擴展的查找記憶結構,在等參數、等算力條件下顯著提升模型在知識調用、推理、代碼、數學等任務上的表現。同時,DeepSeek開源相關記憶模塊Engram。
最新市場快訊
10:42:57
10:41:37
10:40:49