DeepSeek，有新消息！

2026-02-27 16:59:00

每經(jīng)編輯｜張錦河

據(jù)媒體2月27日?qǐng)?bào)道，在業(yè)界對(duì)新一代旗艦?zāi)Ｐ虳eepSeek V4的翹首期盼中，DeepSeek團(tuán)隊(duì)卻悄然放出了一篇新的學(xué)術(shù)論文。

這篇論文由DeepSeek聯(lián)合北大、清華共同撰寫，將研究方向投向了決定大模型實(shí)際應(yīng)用落地的關(guān)鍵一環(huán)——推理速度，為日益復(fù)雜的AI智能體，提供一套高效的底層系統(tǒng)解決方案。

具體來說，新論文介紹了一個(gè)名為DualPath的創(chuàng)新推理系統(tǒng)，專門針對(duì)智能體工作負(fù)載下的大模型（LLM）推理性能進(jìn)行優(yōu)化。通過引入“雙路徑讀取KV-Cache（類似記憶緩存）”機(jī)制，重新分配存儲(chǔ)網(wǎng)絡(luò)負(fù)載，將離線推理吞吐量最高提升 1.87 倍，在線服務(wù)的每秒智能體運(yùn)行數(shù)平均提升 1.96 倍。

論文在引言部分提到，大模型正從單輪對(duì)話機(jī)器人和獨(dú)立推理模型，快速演進(jìn)為智能體系統(tǒng) ——能夠自主規(guī)劃、調(diào)用工具，并通過多輪交互解決實(shí)際任務(wù)。這種應(yīng)用范式的轉(zhuǎn)變，推動(dòng)大模型推理工作負(fù)載發(fā)生重大變革：從傳統(tǒng)的人類-大模型交互，轉(zhuǎn)向人類-大模型-環(huán)境交互，交互輪次可達(dá)數(shù)十甚至數(shù)百輪。

上下文會(huì)跨輪次累積，最終長(zhǎng)度可能達(dá)到極值。此時(shí)模型不需要大量計(jì)算，反而需要頻繁從硬盤讀取歷史上下文的 KV-Cache；現(xiàn)有系統(tǒng)中，只有負(fù)責(zé)預(yù)處理的引擎會(huì)讀取KV-Cache，它的網(wǎng)卡帶寬被占滿，而負(fù)責(zé)生成內(nèi)容的解碼引擎，網(wǎng)卡帶寬基本閑置，導(dǎo)致整個(gè)系統(tǒng)速度被卡脖子。

因此，論文提出的DualPath，針對(duì)智能體工作負(fù)載、重新設(shè)計(jì)現(xiàn)代推理架構(gòu)中 KV-Cache加載邏輯，解決大模型做智能體任務(wù)時(shí)，速度被 “數(shù)據(jù)讀取”拖慢的核心問題，重要的是把閑置的帶寬資源利用起來，相當(dāng)于給數(shù)據(jù)讀取 “多開了一條高速路”，實(shí)現(xiàn)速度的大幅提升。

這一論文成果延續(xù)了DeepSeek一貫的風(fēng)格，在工程化層面將性能優(yōu)化推向極致。有從業(yè)者認(rèn)為，DeepSeek做這類優(yōu)化屬于缺顯卡的無奈之舉，屬于“臟活兒累活兒”，大家更期待團(tuán)隊(duì)在模型上做創(chuàng)新。

關(guān)于DeepSeek V4的發(fā)布時(shí)間，市場(chǎng)傳聞已幾經(jīng)更迭。從最初傳聞的2月春節(jié)前后，到外媒最新報(bào)道的“最快下周”，再到業(yè)內(nèi)人士預(yù)測(cè)的3月前后，傳聞鏈條愈發(fā)撲朔迷離。

就在近日，外網(wǎng)有網(wǎng)友爆料稱，DeepSeek 正在測(cè)試 V4 Lite 模型，代號(hào)為“Sealion-lite”，上下文窗口為 100萬tokens，并原生支持多模態(tài)推理。也有消息提及，DeepSeek已在近期將重大更新版本V4向華為等國(guó)內(nèi)廠商提供提前訪問權(quán)，以支持其優(yōu)化處理器軟件，確保模型在硬件上高效運(yùn)行。然而，英偉達(dá)等廠商尚未獲得類似權(quán)限。

面對(duì)傳聞，DeepSeek依舊保持其一貫的沉默，目前并未進(jìn)行任何回應(yīng)。

此前，DeepSeek被大量用戶吐槽風(fēng)格突變，"變冷淡"，從原本細(xì)膩共情變?yōu)?/span>不稱昵稱、文風(fēng)生硬帶“登味”，共情能力下降。

2月12日晚，話題“Deepseek被指變冷淡了”登上微博熱搜。當(dāng)天，多名用戶反饋，DeepSeek在網(wǎng)頁端和APP端進(jìn)行了版本更新，支持最高1M（百萬）Token的上下文長(zhǎng)度。而去年8月發(fā)布的DeepSeekV3.1上下文長(zhǎng)度拓展至128K。

作為較早入局國(guó)內(nèi)大模型賽道的玩家，DeepSeek憑借早期技術(shù)積累和差異化定位，曾在AI助手市場(chǎng)占據(jù)先發(fā)優(yōu)勢(shì)。而隨著字節(jié)跳動(dòng)豆包、百度文心一言、阿里通義千問等巨頭產(chǎn)品加速迭代，以及ChatGPT、Claude等海外強(qiáng)敵持續(xù)施壓，國(guó)內(nèi)AI助手賽道已進(jìn)入白熱化競(jìng)爭(zhēng)階段。

每日經(jīng)濟(jì)新聞綜合第一財(cái)經(jīng)、公開信息

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

安博通：2025年度凈利潤(rùn)約-1.46億元

返回每經(jīng)網(wǎng)首頁

下一篇文章

新三板創(chuàng)新層公司傳神語聯(lián)大宗交易折價(jià)3.18%，成交金額200.24萬元

相關(guān)文章